当前位置: 首页 > web >正文

AI开发实习生面试总结(持续更新中...)

1.广州视宴(ai开发实习生)

首先是自我介绍~

1.第二个项目中的热力图是用怎么样的方式去做的?


2.在第二个项目中,如何用热力图去实现它的实时变化

答:我这里直接说我项目里面其实静态的热力图,不是动态的

3.如果要你爬虫阿里或者百度的网站,你会怎么做?阿里的做了什么样的反爬机制?

答:我首先说了下百度的反爬机制,后面我发现我没有反爬过阿里的网站,我直接说不会了,现在想来这两个应该是差不多的。

4.OpenCV如果识别人脸和人的身体的话,你会用什么库,比如说你要识别人的身体骨骼的话。

5.你的这个项目是识别人脸的,那你如何确保别人贴个照片在脸上直接过呢?怎么判断它是不是真人?

这个不会

6.transformer模型有没有了解过?

答:我说了一下它的大概结构和自注意力机制

7.现在有一个企业内部资料库,假如你需要把它训练成一个ai智能体,用于相互对话的话,你该怎么做?(我说用这个内部资料库对本地部署的deepSeek-R1模型进行训练,然后使用Pythoweb开发前后端进行交互,把训练后的结果利用网页来让它能够实现相互对话)

8.具体究竟是怎么训练这个智能体的?(我说调用科大讯飞的api进行情感分析和自然语言处理,然后生成结果)

9.那假如我就是不能用api,就是要离线生成答案,我应该怎么做?(这个也不是很会)

10.MCP协议了解过吗?(还真不会)

11.如果让你用OpenCV来用于做情感的识别,你会怎么做?。

答:我回答说OpenCV有一个专门的库是用来识别人脸的,还有几个库是专门识别像微笑,伤心等表情的

12.那如果我要增加它的表情类目的话呢,比如我要识别160种表情,我应该如何去做?

答:当时都傻了,160种表情?我后面直接说只用OpenCV的话是做不到的,我会像我写的第一个项目那样,在Kaggle上下载各个表情下的数据集,然后用YOLOv11的模型在配置好文件之后进行训练


13.那按你这样做的话,准确度能够控制在多少呢?

答:0.8-0.9吧

14.怎么提升这个准确度呢?

答:我回答要么训练次数更高一些,要么做数据增强

15.假如说这个表情识别的项目的受众群体是中国人比较多,但是数据集都是外国人,比如黑人和白人,这个会有什么影响?

答:我直接说由于黑人的嘴唇一般比我们国人要厚一点,可能我们的微笑在黑人那里会识别成假笑?

16.你一般用什么ai工具多一点?就只用过这些吗?

答:我说ChatGPT和deepSeek多一点,我还用过cursor里面的Gemini和Claude模型,只是ChatGPT和deepSeek用的多一点。

17.你觉得deepSeek这个模型是怎么做出来的?

答:我说是用ChatGPT的那个模型进行蒸馏,然后减少那个训练的数据集来降低成本

18.你需要什么样的条件你才能做出这种类型的模型出来。

答:我说好像是用要跟deepSeek差不多的一个训练环境,再模拟deepSeek的方法对ChatGPT进行一个蒸馏

19.假如说我要用deepSeek来让我的公众号实现像ai客服机器人一样去对话,我应该怎么做?

答:先利用爬虫的知识,在app上获取客户发送的消息。然后调用deepSeek的api来生成回答的文本,最后使用模拟器和selminum,DrissionPage这些自动化工具来模拟人的操作,将生成好的文本发送过去

20.那假如说企业有几十个微信账号,让它全都变成客户机器人呢?应该怎么做?
答:(这个我是真的不会了)下多几个模拟器进行类似的操作,或者使用网页版微信来增加它的那个ai客服的运行数据。 

21.比如你那个电脑再使用这个自动化工具,我又不想让这个自动化工具影响我的日常微信的文件使用,我应该怎么做?

答:(这个其实我也不是很会)我说可以不用该脚本,可以想手机那样做应用双开?

22.那按你怎么做的话,跑这些模拟器的项目配置要多高?包括它这个链路该如何去串通起来?

这里有点答非所问了,我说了3080应该可以吧。

23.按你刚刚的那个配置对智能进行训练的话,大概要训练多久?

答:应该是一个星期吧。

24.你是明年毕业是吧,能够实习半年对吗?

答:是的。

反问环节~

总结:

        这次面试让我深刻的意识到了自己的不足,对于这种场景题基本上是一点都不会,我的知识储备跟大佬们比肯定是不足的。我需要再好好的学习一些面试的题目。

 写在最后:

我们可以在这里学习C++知识:

0voice · GitHub

http://www.xdnf.cn/news/8600.html

相关文章:

  • 精华贴分享|个股拥挤度分析研究分析
  • docker安装es连接kibana并安装分词器
  • Windows开机时间过长的原因
  • 射频芯片学习
  • 技术文档的炼金术:从信息碎片到知识体系的系统性构建
  • 《进化陷阱》--AI 生成文章 《连载 1》
  • RxJS 高阶映射操作符详解:map、mergeMap 和 switchMap
  • 大学之大:柏林自由大学2025.5.23
  • feign调用指定服务ip端口
  • winfrom 的 monthCalendar 指定日期字体加粗
  • 辐射发射RE测试
  • 解决用input选择文件不能选择同一个文件
  • Java多线程面试题
  • 白盒测试概念
  • 云原生架构下的企业数字化转型:理念、挑战与最佳实践
  • Honeywell CV-DINA-DI1624-2A 数字输入模块
  • K8s集群Python项目上云部署
  • vue2 全局指令(输入框自定义限制)
  • [crxjs]自己创建一个浏览器插件
  • 嵌入式学习Day27
  • [特殊字符] 构建高内聚低耦合的接口架构:从数据校验到后置通知的分层实践
  • 2025年高防IP与游戏盾深度对比:如何选择最佳防护方案?
  • C语言中地址的加法和减法
  • iOS 上线前的性能与稳定性检查流程实录:开发者的“最后一公里”(含 KeyMob 应用经验)
  • 速卖通OpenAPI商品详情接口开发实战
  • 生产企业ERP系统,项目级ERP系统源码,实现业务流程的全面管理
  • 用DeepSeek提升前端开发效率
  • MCP 服务与 Agent 协同架构的实践解码:双轮驱动下的场景化价值创造
  • 【ICL】上下文学习
  • 数据合法性校验