BB电子

本文相关基金

更多

相关资讯

BB电子动态

投资课:从9.9元AI相机的爆火,看生成式AI产业的发展

字体大小:

简单、快捷、便宜、质量还高。9.9元的某AI相机火了,只需要凑够20余张照片,交给AI去分析,就能得到一套写真照,其精修程度丝毫不亚于专业照相馆的水平。

如同网友的感叹,AI先干掉了照相馆,生成式AI正在进入我们的生活,并快速改变原有的行业格局。在A股投资市场,今年上半年,与人工智能相关的TMT行业获得了巨大关注,也成为上半年表现最亮眼的行业。

以该AI相机软件为代表的生成式AI,其产业概况如何?除了AI相机软件这类应用外,生成式AI产业还有哪些机会有待被挖掘?本期风向将为您梳理解析。

9.9元的AI相机能干什么?

这款AI相机软件已经推出了30多款写真模板,可以用于商务写真、时尚海报、证件照、校园照、怀旧黑白风、古风随拍等。

该款软件的功能基于微调(fine tuning)后的Stable Diffusion开源绘画模型。这里的Stable Diffusion是一款基于扩散过程的深度学习模型,可以支持文生图、图生图、内补绘制和外补绘制等任务。

据媒体报道,该AI相机团队在Stable Diffusion基础上,使用“低秩适应”(Low-Rank Adaptation,即LoRA)方法对模型进行了微调。

而LoRA是一种轻量级优化方法,与传统LLM训练方法不同,LoRA可以在少量数据集上微调模型,从而使模型更好适应新任务,并降低模型的存储和计算成本。

扩散模型去噪过程


图片来源:华泰证券、Benlisquare

用通俗的话来说,上述过程就如同一位厨师在为你烹饪专属的菜肴,Stable Diffusion是厨师,他会根据你提供的信息(比如你提交的照片)来不断尝试将不同食材组合到一起,通过不断的尝试,直到最后生产出你想要的菜肴。

值得注意的是,上述模型属于开源模型,反倒是算力资源是此类AI图片生成软件的竞争关键。

生成式AI的商业模式?

了解了这款AI相机软件的秘密,我们不妨来梳理下现阶段生成式AI的发展状况。

从商业模式的角度看,我们可以将AI分为四个层次,即

  • 基础设施层(AI芯片、AI计算集群、AI云服务);
  • 通用大模型层(生成式AI大模型);
  • 行业模型层(金融、医疗、零售、制造、安全);
  • 场景应用层(文本生成、图像生成、音频生成、视频生成、数字人)。

其中,应用层最接近消费者,拥有最大变现的潜力。

基础设施层,很好理解,人工智能的发展从深度学习时代进入到大模型时代,大规模预训练模型的参数量呈现指数级上升,需要高性能算力的支撑。目前,大规模预训练模型训练算力是以往的10到100倍。

据中国信通院撰写的《中国算力发展指数白皮书(2022年)》,过去10年用于AI训练模型的计算资源激增,AI 训练的计算复杂度每年猛增10倍,人工智能计算已成为主流的计算形态,全球智能算力规模将由2021年232EFlops快速增长至2030年的52.5ZFlops,十年间的复合年化回报率超过80%。

数据来源:信通院

在通用大模型方面,2017年,海外知名科技公司发布具有标志性意义的Transformer模型,该模型的解码模块成为GPT模型的核心要素,通过引入注意力机制,可实现更大规模的并行计算,明显减少模型的训练时间,使得大规模AI模型得以应用。

BERT模型、LaMDA模型在信息提取能力以及安全性等方面不断提升。最新推出的PaLM-E模型具有很强的泛化和迁移能力,在完成视觉语言和通用语言任务的同时,可处理多模态数据(语言、视觉、触觉等),实现指导机器人完成相应任务的功能。

具体应用方面,以图像生成为例,其技术场景划分为图像属性编辑、图像局部生成及更改、端到端的图像生成。其中,前两者落地场景为图像编辑工具,端到端的图像生成则对应创意图像生成及功能性图像生成两大落地场景。

目前,图像编辑工具的使用已较为广泛,相关产品较为丰富;创意图像生成大多以NFT等形式呈现,功能性图像大多以营销类海报/界面、LOGO、模特图、用户头像为主。

从商业收费模式的情况看,多数生成式AI产业尚未建立成熟的变现方式,大部分产品仍处于免费试用“流量吸引+平台改良”阶段。

从全球情况来看,生成式AI的主流营收模式有如下几类:作为底层平台收费、按产出内容收费、软件订阅服务收费、模型训练收费、具体属性收费。其中最具长期增长潜力,并将占据主要市场规模的模式为:作为底层平台收费,即按照数据请求量和实际算量进行定价和计算。

投资视角看下半年AI发展?

数据、算力和算法作为AI三要素,是决定AI发展的重要基础。近年来全球数据规模持续增长,IDC预计到2025年全球数据规模将达到175ZB,为人工智能模型训练提供海量数据资源。

从算力的视角看,高性能AI芯片的推出为大规模预训练模型提供重要算力支撑,而伴随技术的不断发展,Transformer、BERT、LaMDA、ChatGPT等模型实现快速迭代优化。在数据、算力和模型的共同推动下,全球生成式AI产业得以迅速发展,相关场景应用也不断丰富。

BB电子大科技研究总监王贵重认为,本轮人工智能最直接影响的领域就是信息生成和信息交互,可以进一步的提升信息生产和人机交互效率,它将改变人们工作、学习、娱乐、医疗以及彼此交流的方式,甚至未来随着算力成本的下降,我们每一个人有一个AI助理也不是不可能。而未来随着多模态的落地,机器人也会变成可能。几乎每一个行业都会被AI影响和改变。在大机会面前不要机会,在大技术变革面前最优策略是拥抱,无论投资还是生活。

王贵重认为,下半年重点关注两个方向。第一是,曾经被互联网改变的行业会再一次被AI改变。首先是内容,无论是一维媒介文字,二维媒介图片,三维媒介视频,四维媒介游戏,还是社交、搜索、短视频、电商,我们用的互联网应用都会集成AI功能。

第二是软件行业,软件会从功能软件到智能软件,软件的能力会进一步提升,帮我们做更多的事情,交互也会更加友好。无论是办公、OA、CRM、ERP,甚至一些专业的画图、EDA等工具。

*风险提示:基金投资需谨慎。投资人应当阅读《基金合同》《招募说明书》《产品资料概要》等法律文件,了解基金的风险收益特征,特别是特有风险,并根据自身投资目的、投资经验、资产状况等判断是否和自身风险承受能力相适应。基金管理人承诺以诚实信用、谨慎尽责的原则管理和运用基金资产,但不保证基金一定盈利或本金不受损失。过往业绩不预示其未来业绩,其他基金业绩不构成本基金业绩的保证。


投资课:从9.9元AI相机的爆火,看生成式AI产业的发展

2023-07-31 来源:BB电子

以该AI相机软件为代表的生成式AI,其产业概况如何?除了AI相机软件这类应用外,生成式AI产业还有哪些机会有待被挖掘?本期风向将为您梳理解析。

简单、快捷、便宜、质量还高。9.9元的某AI相机火了,只需要凑够20余张照片,交给AI去分析,就能得到一套写真照,其精修程度丝毫不亚于专业照相馆的水平。

如同网友的感叹,AI先干掉了照相馆,生成式AI正在进入我们的生活,并快速改变原有的行业格局。在A股投资市场,今年上半年,与人工智能相关的TMT行业获得了巨大关注,也成为上半年表现最亮眼的行业。

以该AI相机软件为代表的生成式AI,其产业概况如何?除了AI相机软件这类应用外,生成式AI产业还有哪些机会有待被挖掘?本期风向将为您梳理解析。

9.9元的AI相机能干什么?

这款AI相机软件已经推出了30多款写真模板,可以用于商务写真、时尚海报、证件照、校园照、怀旧黑白风、古风随拍等。

该款软件的功能基于微调(fine tuning)后的Stable Diffusion开源绘画模型。这里的Stable Diffusion是一款基于扩散过程的深度学习模型,可以支持文生图、图生图、内补绘制和外补绘制等任务。

据媒体报道,该AI相机团队在Stable Diffusion基础上,使用“低秩适应”(Low-Rank Adaptation,即LoRA)方法对模型进行了微调。

而LoRA是一种轻量级优化方法,与传统LLM训练方法不同,LoRA可以在少量数据集上微调模型,从而使模型更好适应新任务,并降低模型的存储和计算成本。

扩散模型去噪过程


图片来源:华泰证券、Benlisquare

用通俗的话来说,上述过程就如同一位厨师在为你烹饪专属的菜肴,Stable Diffusion是厨师,他会根据你提供的信息(比如你提交的照片)来不断尝试将不同食材组合到一起,通过不断的尝试,直到最后生产出你想要的菜肴。

值得注意的是,上述模型属于开源模型,反倒是算力资源是此类AI图片生成软件的竞争关键。

生成式AI的商业模式?

了解了这款AI相机软件的秘密,我们不妨来梳理下现阶段生成式AI的发展状况。

从商业模式的角度看,我们可以将AI分为四个层次,即

  • 基础设施层(AI芯片、AI计算集群、AI云服务);
  • 通用大模型层(生成式AI大模型);
  • 行业模型层(金融、医疗、零售、制造、安全);
  • 场景应用层(文本生成、图像生成、音频生成、视频生成、数字人)。

其中,应用层最接近消费者,拥有最大变现的潜力。

基础设施层,很好理解,人工智能的发展从深度学习时代进入到大模型时代,大规模预训练模型的参数量呈现指数级上升,需要高性能算力的支撑。目前,大规模预训练模型训练算力是以往的10到100倍。

据中国信通院撰写的《中国算力发展指数白皮书(2022年)》,过去10年用于AI训练模型的计算资源激增,AI 训练的计算复杂度每年猛增10倍,人工智能计算已成为主流的计算形态,全球智能算力规模将由2021年232EFlops快速增长至2030年的52.5ZFlops,十年间的复合年化回报率超过80%。

数据来源:信通院

在通用大模型方面,2017年,海外知名科技公司发布具有标志性意义的Transformer模型,该模型的解码模块成为GPT模型的核心要素,通过引入注意力机制,可实现更大规模的并行计算,明显减少模型的训练时间,使得大规模AI模型得以应用。

BERT模型、LaMDA模型在信息提取能力以及安全性等方面不断提升。最新推出的PaLM-E模型具有很强的泛化和迁移能力,在完成视觉语言和通用语言任务的同时,可处理多模态数据(语言、视觉、触觉等),实现指导机器人完成相应任务的功能。

具体应用方面,以图像生成为例,其技术场景划分为图像属性编辑、图像局部生成及更改、端到端的图像生成。其中,前两者落地场景为图像编辑工具,端到端的图像生成则对应创意图像生成及功能性图像生成两大落地场景。

目前,图像编辑工具的使用已较为广泛,相关产品较为丰富;创意图像生成大多以NFT等形式呈现,功能性图像大多以营销类海报/界面、LOGO、模特图、用户头像为主。

从商业收费模式的情况看,多数生成式AI产业尚未建立成熟的变现方式,大部分产品仍处于免费试用“流量吸引+平台改良”阶段。

从全球情况来看,生成式AI的主流营收模式有如下几类:作为底层平台收费、按产出内容收费、软件订阅服务收费、模型训练收费、具体属性收费。其中最具长期增长潜力,并将占据主要市场规模的模式为:作为底层平台收费,即按照数据请求量和实际算量进行定价和计算。

投资视角看下半年AI发展?

数据、算力和算法作为AI三要素,是决定AI发展的重要基础。近年来全球数据规模持续增长,IDC预计到2025年全球数据规模将达到175ZB,为人工智能模型训练提供海量数据资源。

从算力的视角看,高性能AI芯片的推出为大规模预训练模型提供重要算力支撑,而伴随技术的不断发展,Transformer、BERT、LaMDA、ChatGPT等模型实现快速迭代优化。在数据、算力和模型的共同推动下,全球生成式AI产业得以迅速发展,相关场景应用也不断丰富。

BB电子大科技研究总监王贵重认为,本轮人工智能最直接影响的领域就是信息生成和信息交互,可以进一步的提升信息生产和人机交互效率,它将改变人们工作、学习、娱乐、医疗以及彼此交流的方式,甚至未来随着算力成本的下降,我们每一个人有一个AI助理也不是不可能。而未来随着多模态的落地,机器人也会变成可能。几乎每一个行业都会被AI影响和改变。在大机会面前不要机会,在大技术变革面前最优策略是拥抱,无论投资还是生活。

王贵重认为,下半年重点关注两个方向。第一是,曾经被互联网改变的行业会再一次被AI改变。首先是内容,无论是一维媒介文字,二维媒介图片,三维媒介视频,四维媒介游戏,还是社交、搜索、短视频、电商,我们用的互联网应用都会集成AI功能。

第二是软件行业,软件会从功能软件到智能软件,软件的能力会进一步提升,帮我们做更多的事情,交互也会更加友好。无论是办公、OA、CRM、ERP,甚至一些专业的画图、EDA等工具。

*风险提示:基金投资需谨慎。投资人应当阅读《基金合同》《招募说明书》《产品资料概要》等法律文件,了解基金的风险收益特征,特别是特有风险,并根据自身投资目的、投资经验、资产状况等判断是否和自身风险承受能力相适应。基金管理人承诺以诚实信用、谨慎尽责的原则管理和运用基金资产,但不保证基金一定盈利或本金不受损失。过往业绩不预示其未来业绩,其他基金业绩不构成本基金业绩的保证。


Sitemap