
微软开源多模态AI Agent—Magma
今天凌晨3点,微软在官网开源了多模态AI Agent基础模型——Magma。与传统Agent相比,Magma具备跨数字、物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据,例如,你可以用Magma来自动下电商订单、查询天气;也可以自动操作实体机器人,或者下真实象棋时获得帮助。此外,Magma还能内置了心理预测功能,增强了对未来视频帧中时空动态的理解能力,能够准确推测视频中人物或物体的意图和未来行为。


全部评论
机会情报
- 顶层设计、地方发力,兼具“安全、双碳”属性的海洋经济迎来高成长
- AI游戏顶级行业盛会明日召开,AI原生游戏玩法创新加速有望抬升行业整体估值
- 光伏行业再现抢装潮 电池片价格全面上涨
- 发改委等部门下午举行新闻发布会,介绍提振消费有关情况
- 英伟达GTC大会本周召开,BlackwellUltraGB300和B300系列芯片或将亮相
- AMD宣布本周举办AIPC盛会,2025年AIPC或迎来爆发期
- 闪迪之后,美光、三星电子、SK海力士等NAND厂商均将从4月起提高报价
- 软硬件及生态全新突破,华为终端全面进入原生鸿蒙时代
- 杭州发布首个算力资源调度服务平台,算力基建进入新模式
- 呼和浩特发布育儿补贴细则,积极关注受益出生率提升的相关板块机会