日前推出加强逻辑推理的人工智慧模型“QwQ-32B-Preview”,阿里巴巴稍早宣布推出加入视觉推论能力的人工智慧模型“QVQ-72B-Preview”,并且强调在语言理解与视觉推论有大幅进展,标榜能解决複杂问题。 “QVQ-72B-Preview”除了在参数数量规模增加至720亿组,更加入影像识别能力,配合大型自然语言模型的理解分析能力,透过前后文理解推论与视觉分析,进而推理解决複杂问题的方法。 阿里巴巴表示,“QVQ-72B-Preview”将可用于大型家具于空间模拟放置,或是用于医疗影像分析诊断。同时,“QVQ-72B-Preview”在MathVista、MathVision、OlympiadBench的数学即可学基准测试取得优异表现,更在MathVision效能表现贴近OpenAI推出的o1人工智慧模型。 阿里巴巴, 阿里巴巴推出加入视觉推论能力、参数规模加大的人工智慧模型“QVQ-72B-Preview”<br><span style='color:#848482;font-size:16px;'>强调在语言理解与视觉推论有大幅进展,标榜能解决複杂问题</span>, mashdigi-科技、新品、趣闻、趋势 不过,由于目前仍处于预览阶段,因此“QVQ-72B-Preview”在执行运作时可能会出现递归推理循环情况,同时在混用不同语言情况下也会增加其执行反应时间。 目前“QVQ-72B-Preview”已经透过Hugging Face平台託管,以开源形式提供所有人取用。 |