2月18日,大模型“六小虎”之一阶跃星辰和吉利汽车集团联合宣布,双方合作的阶跃两款Step系列多模态大模型将向全球开发者开源。此次开源的模型包含目前全球范围内参数量最大的开源视频生成模型阶跃Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃Step-Audio。
HuggingFace工程师评价
据记者了解,这也是阶跃星辰首次开源其Step系列基座模型。阶跃星辰创始人、CEO姜大昕表示:“我们深知AGI(通用人工智能)的实现,离不开全球开发者的共同努力。开源的初心,一方面是希望跟大家分享最新技术成果,为开源社区贡献一份力量;另一方面,我们相信多模态模型是实现AGI的必经之路,但目前尚处于早期阶段,期待与社区开发者集思广益,共同拓展模型技术边界,并推动产业落地。”
在全球顶级开源社区HuggingFace上,已有多名用户在实测阶跃星辰开源模型的视频生成效果。HuggingFace联合创始人兼首席执行官Clem Delangue转发工程师的发言称:“阶跃星辰是下一个DeepSeek。趁服务器拥堵前尝试下这两款模型。”
两款多模态模型开源
阶跃星辰于2023年4月在上海市徐汇区成立,是当下少数坚守AGI的企业之一。根据姜大昕的规划,阶跃星辰实现AGI的技术路线是:“单模态—多模态—多模理解和生成的统一—世界模型—AGI”。
2024年12月,记者获悉,阶跃星辰已于近日完成B轮融资,总融资金额达数亿美元。此次融资有国资、战略和财务投资人等参与,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。
用户实测Step-Video-T2V模型
回看此次宣布开源的两款模型,阶跃Step-Video-T2V模型的参数量达到300亿,可直接生成204帧、540P分辨率的高质量视频。这意味着,生成的视频内容具有极高的信息密度和强大的一致性。
从生成效果来看,阶跃Step-Video-T2V在复杂运动、美感人物、视觉想象力、基础文字生成、原生中英双语输入和镜头语言等方面具备强大的生成能力,且语义理解和指令遵循能力突出,能够高效助力视频创作者实现精准创意呈现。
阶跃Step-Audio是行业内首个产品级的开源语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地高质量对话。模型生成的语音具有超自然、“高情商”等特征,同时也能实现高质量的音色复刻并进行角色扮演,满足影视娱乐、社交、游戏等行业场景下应用需求。
大模型开源呈“加速”之势
长期以来,全球大模型企业在开闭源的方向上有着不同定位,围绕开闭源的路线之争也颇为激烈。开闭源对应两种软件开发模式——开源指开放源代码,将源代码公开发布并允许任何人查看、修改和使用;闭源则不公开源代码,只对外发布编译后的软件。
OpenAI原本凭借技术壁垒和闭源模式在AI领域占据优势,但DeepSeek的开源模式和低成本可能降低行业进入门槛,削弱其技术垄断地位。
阿里云智能科技研究中心主任安琳称:“开源和闭源路径,本就不意味着性能差异,而是商业策略的选择。不管哪种路径,更重要的是如何形成可持续的商业化闭环。大模型的能力的确在不断提升,但也面临着边际效益降低的瓶颈。只有将前期投入转化为商业化收入,继续赋能技术提升,这项技术的创新和应用才能持续下去。”
在DeepSeek的影响下,多家开源路线坚定的反对者倒戈了。2月14日,百度宣布,将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。百度曾是闭源路线的拥趸——在2024世界人工智能大会期间,百度创始人、董事长兼首席执行官李彦宏曾表示,开源其实是一种智商税。“无论是ChatGPT、还是文心一言等闭源模型,一定比开源模型更强大,推理成本更低。”
最新消息显示,OpenAI也可能即将开源某个大模型。OpenAI CEO山姆·奥尔特曼(Sam Altman)近日发文征集意见:“对于我们的下一个开源项目,哪一种更有用:做一个相当小但仍需要在GPU上运行的o3-mini级模型,还是做一个我们能做的最好的适合手机运行的模型更有用?”
作者:孙小程
- 随机文章
- 热门文章
- 热评文章
- 宜州创写||《触碰过的梦》:河池学院2021级写作班杨汉武小说发表于《微型小说月报》2024年第5期
- 让IP在中国动漫市场里发光,番茄小说需要做什么?
- 一年拦截1.1亿次非法攻击,番茄小说上线千余条策略打击盗版
- 2023年度中国网络文学影响力榜发布,番茄小说《斩神》等作品上榜
- 完美世界影视牵手番茄小说 头部IP作品《何不同舟渡》影视化提上日程
- 七猫免费小说鸿蒙原生应用核心版本交付,全场景阅读体验升级!
- 三本古言脑洞小说,敌国陛下变成一只猫怎么办?还叫我母后唉
- 盘点大神皇甫奇七部高口碑小说,喜欢玄幻爽文的读者可以看一下!
还没有评论,来说两句吧...