当前位置: 主页 > 资讯

豆包大模型1.6-vision正式发布:首次具备工具调用能力

2025-09-30 20:56人气:编辑:思思 来源:

9月30日消息,据“火山引擎”微信公众号发文,豆包大模型1.6-vision正式发布,这是豆包大模型家族首个具备工具调用能力的视觉深度思考模型,拥有更强的通用多模态理解和推理能力,并支持Responses API。

豆包大模型1.6-vision正式发布:首次具备工具调用能力(图1)

新模型以工具调用的差异化能力,将图像融入其思维链中,实现对图片的定位、剪裁、点选、画线、缩放、旋转等精细处理。 并通过模拟人类从“从全局扫描到局部聚焦”的视觉推理过程,在增强推理可解释性的同时,可高效精准地完成图像操作。

豆包大模型1.6-vision正式发布:首次具备工具调用能力(图2)

豆包大模型1.6-vision支持Responses API,可自主选择调用工具,大幅度减少Agent开发过程中的代码量,提升开发效率,让开发 者应用开发更加高效。

此外,对比上一版视觉理解模型Doubao-1.5-thinking-vision-pro,综合成本降低约50%,以更低成本解锁更强性能。

豆包大模型1.6-vision正式发布:首次具备工具调用能力(图3)

本文转载于快科技,文中观点仅代表作者个人看法,本站只做信息存储

显示全部

收起

本站部分文章来自网络或用户投稿,仅供信息存储。阅读前请先查看【免责声明】,若本文侵犯了原著者的合法权益,可联系我们进行处理。本文链接:https://m.trustany.com/post/11971.html

相关文章
热门频道
  • 互联网
  • 生活服务
  • 好物攻略
  • 旅游出行
  • 休闲娱乐

访问电脑版 | 返回首页 | 博西网