
主要更新
增加DeepSeek V3.2,Qwen,GPT-5.1和Gemini 3 Pro等大模型。
DeepSeek V3.2
这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制), 针对长文本的训练和推理效率进行了探索性的优化和验证。
通义千问Max
通义千问是由阿里云自主研发的语言模型,正式向公众开放于2023年9月13日。它的名称“通义”意为“通情达义”,体现了其全面的AI能力,致力于成为人们的工作、学习和生活助手。通义千问支持多轮对话、文案创作、 逻辑推理和多语言理解等功能。
OpenAI GPT-5.1
GPT-5.1是GPT-5系列中最新的前沿级模型,相比GPT-5具备更强的通用推理能力、更优的指令遵循度以及更自然的对话风格。它采用自适应推理机制动态分配计算资源,对简单查询快速响应,对复杂任务则投入更深层处理。该模型能生成更清晰、更接地气的解释,减少专业术语使用,即使面对技术性或多步骤问题也更易理解。
为实现广泛任务覆盖而打造的GPT-5.1在数学计算、编程实现及结构化分析等工作负载中均取得显著提升,不仅能生成更连贯的长篇解答,工具使用可靠性也得到增强。其对话一致性经过优化,可在保持精确性的同时提供更温暖直观的回应。GPT-5.1作为GPT-5的核心全面升级版,将承担其主要接替任务。
Google: Gemini 3 Pro
Gemini 3 Pro 是谷歌旗下用于高精度多模态推理的旗舰前沿模型,在文本、图像、视频、音频和代码领域均展现出卓越性能,并支持 100 万令牌的上下文窗口。使用多轮工具调用时必须保留推理细节
Gemini 3 Pro专为高级开发与智能体工作流打造,提供强大的工具调用能力、长周期规划稳定性及强劲的零样本生成能力,可应对复杂的用户界面设计、可视化及编码任务。其在智能体编程(SWE-Bench认证、Terminal-Bench 2.0)、多模态分析及结构化长文任务(如研究综述、规划设计、交互式学习体验)领域表现卓越。适用场景涵盖自主智能体、编程助手、多模态分析、科学推理及高语境信息处理。
联系
官网: https://ilark.io
文档: https://doc.ilark.io
Github: https://github.com/ilarkdao
Discord: https://discord.gg/p9KTdmVrfb
Medium: https://medium.com/@ilark_dao
twitter: @ilark_dao
Gmail: [email protected]
deepseek 我挺喜欢用的 哈哈 分析得很详细,很全面😄
支持下国产啰