当前位置: 首页 > java >正文

大模型就业方向

有如下几个方向:

基座模型训练

  • 工作内容:优化模型结构、数据比例,实现在各种任务上效果比较好的通用基座模型

  • 护城河:出了问题只有你能解决,给足情绪价值

  • 经验要求:

    • 必备:模型分布式框架(如deepspeed)、多机多卡训练、顶会的经验;阅读一系列 LLM 经典论文,例如 Instruct-GPT、LORA 等,从而对 LLM 有一个更深入、透彻的掌握。同

    • 任选:

      • 万卡集群的训练经验(包括预训练、sft、强化学习)、踩坑经验;

      • 数据配比调优、模型结构调优的经验;

      • 各类魔改信手捏来、快速实现并完成验证,给足情绪价值

  • 现状:人才比较紧缺,市场薪资最高

大模型微调

  • 工作内容:对开源LLM进行分布式微调并不断迭代优化Bad Case。目前,LLM 微调一般有两种核心工作:一是微调 LLM 来解决实际业务问题,另一个就是微调垂域大模型,如医学大模型、法律大模型等。

  • 推荐的开源教程:

1.深度学习入门经典教程《李宏毅深度学习教程》:https://github.com/datawhalechina/leedl-tutorial

2.深入浅出、从理论到实践的 Pytorch 教程《深入浅出Pytorch》: https://github.com/

datawhalechina/thorough-pytorch

3. 全面介绍 LLM 理论基础的《So Large LM》:https://github.com/datawhalechina/so-large-lm

4.提供LLM 的调用、部署、微调全链路手把手教学的《Self LLM--开源大模型食用指南》:https://github.com/datawhalechina/self-llm

大模型开发

  • 工作内容:RAG、Agent、优化prompt。RAG:便于和搜推结合,降低模型幻觉。但是,随着模型max token的扩大,RAG不是必须的了

  • 护城河:在不能做精的情况下,把自己的角色做宽(不局限于自己是算法工程师,多从产品视角、工程视角系统的分析问题),在大模型的加持下做一些全站开发的事情。亮点:垂直领域的agent

  • 经验要求:搜推等

  • 现状:做的人最多(大部分人受限于训练条件)

  • 推荐的开源教程:

1.聚焦于如何使用ChatGPT相关API创造新的功能和应用的《Hugging LLM》:https://github.com/datawhalechina/hugging-llm

2.面向小白开发者的大模型应用开发教程《LLM Universe -- 动手学大模型应用开发》:(https://github.com/datawhalechina/llm-universe

3.基于 MetaGPT 框架的多智能体开发教程《Hugging Multi-Agent》:https://github.com/datawhalechina/hugging-multi-agent

大模型推理部署

  • 工作内容:分为模型量化、模型部署、推理加速,一般在大型企业的架构部门,在一些企业中,负贵训练模型算法工程师也需要兼顾模型部署和推理。需要学习一些经典的框架:分布式框架 Deepspeed、部署推理框架 VLLM 和量化框架 accelerate。

  • 其中,模型量化:将全精度模型量化成混合精度的模型,效果上的损失带来性能上的优化;模型部署:优化推理速度,属于偏工程化的方向,但是需求量比较大

  • 护城河:与开源框架拉开的差距

  • 经验要求:并行化量化、蒸馏等各种加速的经验;深入其原理和源码;上手真实业务场景下 LLM 的部署与推理加速;也可以进行 CUDA 编程的学习,从更底层掌握 LLM 的部署优化

  • 现状:需求量大,因为每个公司都需要有大模型落地的话,就需要有相关人才

多模态大模型

  • 工作内容:文生图/视频、图/视频生文

  • 护城河:暂无说明

  • 经验要求:暂无说明

  • 现状:多尺寸的模型,应用场景不少,如:妙鸭相机、Sora的视频生成

结尾

亲爱的读者朋友:感谢您在繁忙中驻足阅读本期内容!您的到来是对我们最大的支持❤️

正如古语所言:"当局者迷,旁观者清"。您独到的见解与客观评价,恰似一盏明灯💡,能帮助我们照亮内容盲区,让未来的创作更加贴近您的需求。

若此文给您带来启发或收获,不妨通过以下方式为彼此搭建一座桥梁: ✨ 点击右上角【点赞】图标,让好内容被更多人看见 ✨ 滑动屏幕【收藏】本篇,便于随时查阅回味 ✨ 在评论区留下您的真知灼见,让我们共同碰撞思维的火花

我始终秉持匠心精神,以键盘为犁铧深耕知识沃土💻,用每一次敲击传递专业价值,不断优化内容呈现形式,力求为您打造沉浸式的阅读盛宴📚。

有任何疑问或建议?评论区就是我们的连心桥!您的每一条留言我都将认真研读,并在24小时内回复解答📝。

愿我们携手同行,在知识的雨林中茁壮成长🌳,共享思想绽放的甘甜果实。下期相遇时,期待看到您智慧的评论与闪亮的点赞身影✨!

万分感谢🙏🙏您的点赞👍👍、收藏⭐🌟、评论💬🗯️、关注❤️💚~


自我介绍:一线互联网大厂资深算法研发(工作6年+),4年以上招聘面试官经验(一二面面试官,面试候选人400+),深谙岗位专业知识、技能雷达图,已累计辅导15+求职者顺利入职大中型互联网公司。熟练掌握大模型、NLP、搜索、推荐、数据挖掘算法和优化,提供面试辅导、专业知识入门到进阶辅导等定制化需求等服务,助力您顺利完成学习和求职之旅(有需要者可私信联系) 

友友们,自己的知乎账号为“快乐星球”,定期更新技术文章,敬请关注!   

http://www.xdnf.cn/news/16094.html

相关文章:

  • Log4j CVE-2021-44228 漏洞复现详细教程
  • 【lucene】实现knn
  • Git 完全手册:从入门到团队协作实战(4)
  • DP系列2【01背包】洛谷 P1049 [NOIP 2001 普及组] 装箱问题题解
  • 构建高性能推荐系统:MixerService架构解析与核心实现
  • K8s:离线部署Kubernetes1.26.12及采用外部Harbor
  • .net core接收对方传递的body体里的json并反序列化
  • P5535 【XR-3】小道消息
  • 【MyBatis-Plus】核心开发指南:高效CRUD与进阶实践
  • 83、设置有人DTU设备USR-M100采集传感器数据,然后上传阿里云服务
  • 【音视频学习】五、深入解析视频技术中的像素格式:颜色空间、位深度、存储布局
  • CodeBuddy IDE实战:用AI全栈能力快速搭建课程表网页
  • 借助Aspose.HTML控件,使用 Python 编程将网页转换为 PDF
  • Object Sense (OSE):一款从编辑器脚本发展起来的编程语言
  • 优化:Toc小程序猜你喜欢功能
  • Java 堆(优先级队列)
  • AI 及开发领域动态与资源汇总(2025年7月23日)
  • 编程语言Java——核心技术篇(二)类的高级特性
  • 逆向入门(41)程序逆向篇-crackme
  • OceanBase数据库
  • 设备虚拟化技术
  • 从零开始学习Dify-Excel数据可视化(四)
  • Rocky9部署Zabbix7(小白的“升级打怪”成长之路)
  • 【bug】websocket协议不兼容导致的一个奇怪问题
  • (46)elasticsearch-华为云CCE无状态负载部署
  • #Linux内存管理# 在一个播放系统中同时打开几十个不同的高清视频文件,发现播放有些卡顿,打开视频文件是用mmap函数,请简单分析原因。
  • MCU芯片AS32S601在卫星光纤放大器(EDFA)中的应用探索
  • VPS海外部署Linux分布式计算任务调度-跨国资源整合方案
  • k8s:docker compose离线部署haborV2.13.1及采用外部的postgresql及redis数据库
  • uni-app动态获取屏幕边界到安全区域距离的完整教程