当前位置: 首页 > backend >正文

大模型开发工具的汇总

以下是一份关于大模型开发工具的汇总,涵盖Gemini CLI、Qwen-Code、Kimi K2等工具的关键信息:

Gemini CLI

Gemini CLI是Google DeepMind推出的命令行工具,用于调用Gemini系列大模型(如Gemini 1.5)。支持本地与API调用,适用于代码生成、文本处理等任务。

  • 功能特性:支持多模态输入(文本/图像)、上下文长度扩展至百万tokens、Python SDK集成。
  • 安装:https://github.com/google-gemini/gemini-cli,需配置API密钥。
  • 示例命令
    npx https://github.com/google-gemini/gemini-cli
    

Qwen-Code

通义千问团队开发的代码专用大模型,支持Python、C++等编程语言的生成与补全,专注于代码场景优化。

  • 功能亮点:GitHub仓库级代码理解、IDE插件(VS Code/JetBrains)、微调工具链。
  • 部署方式
    • Hugging Face模型库直接加载Qwen/CodeQwen-7B
    • 本地运行需16GB以上显存,推荐使用transformers库调用。
  • 安装
    • https://github.com/QwenLM/qwen-code
    • 1.
    • npm install -g @qwen-code/qwen-code
      qwen --version
      qwen

    • 2. 大模型服务平台百炼控制台  获取API-KEY
    • 3. mkdir myprj
    • 4. vi myprj/.env
    • 文件内容
    • export OPENAI_API_KEY="sk-xxxx"  #此处改为从阿里百炼控制台获取的API-KEY
      export OPENAI_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1"
      export OPENAI_MODEL="qwen3-coder-480b-a35b-instruct"
      #export OPENAI_MODEL="qwen3-coder-plus"

      参考文档:

    • https://www.kdjingpai.com/qwen-codejiyu-g/
      国内AI大模型编程能力的进步

Kimi K2

月之暗面(Moonshot)推出的Kimi Chat开发者版本,支持长文本(200K上下文)与复杂逻辑推理。

  • 核心能力:文档解析(PDF/Word)、API自动化、中文场景优化。
  • 访问方式
    • 官网申请内测权限,提供Web界面与API。
    • 命令行工具可通过curl调用:
      curl -X POST https://api.moonshot.cn/v1/chat -H "Authorization: Bearer $API_KEY" -d '{"model":"kimi-2", "messages":[{"role":"user", "content":"解释Transformer架构"}]}'
      

Trae CN v2.0.4 版本正式发布。

  • 支持新模型 Kimi-K2 和 Qwen3-Coder。

选择建议

  • 轻量级开发:Gemini CLI适合快速原型验证。
  • 代码专项任务:Qwen-Code在代码生成场景表现更优。
  • 长文本处理:Kimi K2的200K上下文窗口适合文档分析。

注:部分工具需申请API权限或特定硬件环境,建议参考官方文档获取最新配置要求。

http://www.xdnf.cn/news/17428.html

相关文章:

  • SQL Server从入门到项目实践(超值版)读书笔记 23
  • cursor, vscode黄色波浪线警告问题
  • 从零到精通:嵌入式BLE开发实战指南
  • 计算机网络:(十四)传输层(下)详细讲解TCP报文段的首部格式,TCP 可靠传输的实现与TCP 的流量控制
  • Mybatis和MybatisPlus的对比区分理解法
  • 基于 RabbitMQ 死信队列+TTL 实现延迟消息+延迟插件基本使用
  • 给AI装上“翻译聚光灯”:注意力机制的机器翻译革命
  • Docker 镜像常见标签(如 `标准`、`slim`、`alpine` 和 `noble`)详细对比
  • 编程基础之字符串——统计数字字符个数
  • TypeScript 中的as const是什么?
  • React:useEffect 与副作用
  • token危机解决?扩散模型数据潜力3倍于自回归,重训480次性能仍攀升
  • 浏览器CEFSharp88+X86+win7 之多页面展示(四)
  • LLaMA-Adapter Efficient Fine-tuning of Language Models with Zero-init Attention
  • Redis - 使用 Redis HyperLogLog 进行高效基数统计
  • Spring Boot与WebSocket构建物联网实时通信系统
  • 基于Spring Boot和WebSocket的实时聊天系统
  • go语言运算符
  • 遇到前端导出 Excel 文件出现乱码或文件损坏的问题
  • Linux 管道命令及相关命令练习与 Shell 编程、Tomcat 安装
  • 基于Ubuntu20.04的环境,编译QT5.15.17源码
  • Lua语言元表、协同程序
  • JavaWeb(苍穹外卖)--学习笔记17(Apache Echarts)
  • LightGBM 与 GBDT 在机器学习中的性能与特点比较
  • Graph-R1:一种用于结构化多轮推理的智能图谱检索框架,并结合端到端强化学习
  • 【最后203篇系列】031 构建MCP尝试
  • Docker Compose 部署高可用 MongoDB 副本集集群(含 Keepalived + HAProxy 负载均衡)
  • 从零学习three.js官方文档(二)——图元
  • 去除Edge微软浏览器与Chrome谷歌浏览器顶部出现“此版本的Windows不再支持升级Windows 10”的烦人提示
  • JavaWeb(苍穹外卖)--学习笔记18(Apache POI)