启明创投报告:2024年中国将出现比肩GPT-4的大模型
7月7日,2023年国际人工智能大会上,启明创投联合未尽研讨发布了创投职业首份生成式AI陈述。根据生成式AI的立异使用、大模型技能前沿、监管、安全、方针、人才等研讨,陈述对未来一至三年的大言语模型、多模态模型和商业竞赛态势,作出了十点前瞻。
其间,大言语模型方面:
- 2024 年我国将呈现比肩GPT-4的多言语通用大模型;
- 超长上下文(Long Context) 将引领下 一次LLM技能打破;
- 在呈现更有远景的大言语模型之前,为完成笔直范畴更好的效果,以下三种办法将共存: 在不改变数据散布的情况下,使用更多通用数据 进行通用大模型预练习,不特别引进职业数据;使用职业专属数据微调( Fine-Tuning)通用大模型;使用职业数据占比更高的数据集进行笔直模型预练习;
多模态模型方面:
- 当时CLIP + Diffusion的文生图模型是过渡态,未来2年内将呈现一体化的模型结构;
- 下一代Text-to-Image模型将具有更强的可控性,它将结合底层模型才能和前端操控办法,对模型的规划将重视与操控办法的结合;
- 2025之前,视频和3D 等模态将迎来里程碑式的模型,大幅进步生成效果;
- 以PALM-E为代表的具身智能(Embodied AI)展示出在机器人的感知、 了解和决议计划等方向上的巨大潜力, 但当时练习和可靠性存在较大应战;
- 短期内Transformer正成为多个模态的干流网络结构, 但紧缩整个数字国际的通用办法没有呈现,Transformer并不是人工智能技能的结尾;
商业时机方面:
- 3年内,推翻式的AI使用的中心驱动力来自于底层模型的立异,两者无法解耦,模型的效果将大于产品规划的效果;
- 当时生成式AI 商场处于技能主导的前期阶段, 存在千亿美元市值的渠道性企业的时机。