AIGC(AI-Generated Content 人工智能生成内容)代表新一轮范式转移的开始。近期,硅谷的众多一线 VC 们开始将目光瞄准 AI 初创公司,尤其是生成式 AI 艺术这一领域。今年有两家独角兽 Stability 和 Jasper 均获得了超过一亿美元的融资,估值突破十亿美元。AIGC 赛道火爆不仅得益于技术进步、商业应用广泛和需求增长,还归功于该赛道还处于早期。虽然大型科技公司捕获了大量价值,初创企业仍有机会突破。
AIGC 将是 Web3 时代的生产力工具。当我们迈入 Web3.0 时代,人工智能、关联数据和语义网络构建,形成人与网络的全新链接,内容消费需求飞速增长。UGC\PGC 这样的内容生成方式将难以匹配扩张的需求。AIGC 将是新的元宇宙内容生成解决方案。AIGC 的生成利用人工智能学习知识图谱、自动生成,在内容的创作为人类提供协助或是完全由 AI 产生内容。不仅能帮助提高内容生成的效率,还能提高内容的多样性。随着 NLP(Natural Language Processing,自然语言处理)技术和扩散模型(Diffusion Model)的发展,AI 不再仅作为内容创造的辅助工具,创造生成内容成为了可能。由此,将来文字生成、图片绘制、视频剪辑、游戏内容生成皆可由 AI 替代。
AIGC 技术主要涉及两个方面:自然语言处理 NLP 和 AIGC 生成算法。自然语言处理是实现人与计算机之间如何通过自然语言进行交互的手段。AIGC 生成算法主流的有生成对抗网络 GAN 和扩散模型。扩散模型已经拥有了成为下一代图像生成模型的代表的潜力。它具有精度更高、可扩展性和并行性,无论是质量还是效率均有所提升,其快速发展成为 AIGC 增长的拐点性因素。同时,在机器学习的过程中,需要通过大量的训练来实现更准确的结果,目前以英伟达 A100 为主,对于底层算力需求将有飞速增长。
AIGC 在文字、图像、音频、游戏和代码生成中商业模型渐显。近期我们研究了国内外数十家 AIGC 相关企业,尤其在一些具备高重复性的任务、对于精度要求并不那么高的领域应用已逐步成熟,并在探索商业模式中。目前图片生产、文字生成较为常见,这类 AIGC 服务大多数时候会以提供 SaaS 服务的形式变现。
AIGC 未来发展核心:大模型、大数据与大算力。结合自然语言的大模型与数据集已成为 AIGC 发展的软件基础,OpenAI 的 Clip 模型基于 4 亿组高质量的英文图文对应数据训练而成;算力即权力将在 AIGC 数字时代更加凸显, Stable Diffusion 目前依赖于 4000 个英伟达 A100 的 GPU 集群,运营成本超 5000 万美金。为了让功能更加精确,未来还将更多地基于语种去开发垂直类的应用,便于更有目的性地为特定功能进行训练。
AIGC 投资框架:软硬件与数据集。生成算法、NLP 与算力决定 AIGC 能否运行,而高质量的数据集决定了 AIGC 质量与商业模式。
- 软件层面主要包括自然语言处理技术:谷歌、微软、科大讯飞、拓尔思;
- AIGC 生成算法模型及数据集:英伟达、Meta、百度、蓝色光标、视觉中国、昆仑万维;
- 算力层包括:澜起科技、中兴通讯、新易盛、天孚通信、宝信软件、中际旭创等。
风险提示:技术创新不及预期:AIGC 的技术发展不及预期。以及底层硬件技术,如:超级计算机、算力的发展不及预期。政策监管风险:目前 AIGC 还处于相对早期,后续是否会出台 AIGC 作品相关知识版权或其他法律监管条款尚不明确。
1. 2022:AIGC 的崛起之年
近期,硅谷的众多一线 VC 们开始将目光瞄准 AI 初创公司,尤其是生成式 AI 艺术这一领域。今年 9 月 23 日,红杉美国官网发表了一篇名为《生成式 AI:一个创造性的新世界》的文章,认为 AIGC(AI-Generated Content 人工智能生成内容)会代表新一轮范式转移的开始。
2022 年 10 月,英国开源人工智能公司 Stability AI 宣布获得 1.01 亿美元融资,估值高达 10 亿美元,跻身独角兽行列,由 Coatue、Lightspeed Venture Partners 和 O’Shaughnessy Ventures LLC 参与投资。Stability AI 今年发布了 Stable Diffusion 的模型,主要用于根据用户输入的文字描述自动生成图像。Stable Diffusion 的诞生让 AI 绘画这个领域愈发火爆。最近,巴比特正式对外宣布,全面拥抱 AIGC,开始规模化采用 AI 配图,其中头条图片,全面由 AI 创作。包括但不限于巴比特网站和 APP,微信公众号、百家号、网易号等自媒体平台,以及微博等社交媒体账号。
除了绘画以外,文字、音频、视频均可通过 AI 来生成。
文字:以 Jasper 为例,以 AI 文字生成为主打产品,通过其文字生成功能,用户可以生成 Instagram 标题,编写 TikTok 视频脚本、广告营销文本、电子邮件内容等工作。截止 2021 年,Japer 已拥有超过 70000 位客户,并创造了 4000 万美元的收入。
音频:以 Podcast.ai 为例,作为一个由 AI 生成的博客,每周都会探讨一个话题。在第一期节目中,其通过乔布斯的传记和收集网络上关于他的所有录音,Play.ht 的语言模型大量训练,最终生成了一段假 Joe Rogan 采访乔布斯的播客内容。
视频:目前的 AI 技术不仅可以生成图片,也能够生成序列帧,如:《幻觉东京》。经过 160 小时,完成 3 万多张独立插画,再进行手动微调。虽然目前还只是在原脚本和视频的基础上,通过 AI 逐帧完成图片生成的,但看到了 AIGC 参与到视频创作中的可能。而在诸多垂直类应用中,如体育、财经等,已经可以通过文字直接生成相应的短视频,如果配上虚拟人则可以实现自动播报。相比于单一的虚拟人读稿,基于 AIGC 生产的内容在镜头转换、表情动作结合方面更加逼真、自然。
随着 NLP(Natural Language Processing,自然语言处理)技术和扩散模型(Diffusion Model)的发展,AI 创造生成内容成为了可能。此前,内容生成主要运用 GAN(Generative Adversarial Network,生成对抗网络)来实现的,GAN 不同于扩散模型依赖于超大规模语言模型,因此难以实现通过文字的描述,自主理解内容并创造出图像、视频等。近年来,随着扩散模型的成熟,生成方式更接近于人脑的联想,AIGC 完成了内容创造辅助工具到内容创作主体的角色转变。