阿里巴巴推出加入视觉推论能力、参数规模加大的人工智慧模型“QVQ-72B-Preview” ...

2024-12-26 17:35| 发布者: admin| 查看: 64| 评论: 0

摘要: 日前推出加强逻辑推理的人工智慧模型“QwQ-32B-Preview”，阿里巴巴稍早宣布推出加入视觉推论能力的人工智慧模型“QVQ-72B-Preview”，并且强调在语言理解与视觉推论有大幅进展，标榜能解决複杂问题。“QVQ-72B-Prev ...

日前推出加强逻辑推理的人工智慧模型“QwQ-32B-Preview”，阿里巴巴稍早宣布推出加入视觉推论能力的人工智慧模型“QVQ-72B-Preview”，并且强调在语言理解与视觉推论有大幅进展，标榜能解决複杂问题。

“QVQ-72B-Preview”除了在参数数量规模增加至720亿组，更加入影像识别能力，配合大型自然语言模型的理解分析能力，透过前后文理解推论与视觉分析，进而推理解决複杂问题的方法。

阿里巴巴表示，“QVQ-72B-Preview”将可用于大型家具于空间模拟放置，或是用于医疗影像分析诊断。同时，“QVQ-72B-Preview”在MathVista、MathVision、OlympiadBench的数学即可学基准测试取得优异表现，更在MathVision效能表现贴近OpenAI推出的o1人工智慧模型。

阿里巴巴, 阿里巴巴推出加入视觉推论能力、参数规模加大的人工智慧模型“QVQ-72B-Preview”<br><span style='color:#848482;font-size:16px;'>强调在语言理解与视觉推论有大幅进展，标榜能解决複杂问题</span>, mashdigi－科技、新品、趣闻、趋势

不过，由于目前仍处于预览阶段，因此“QVQ-72B-Preview”在执行运作时可能会出现递归推理循环情况，同时在混用不同语言情况下也会增加其执行反应时间。

目前“QVQ-72B-Preview”已经透过Hugging Face平台託管，以开源形式提供所有人取用。