昨天讲完了经济的分享,今天应该讲政治的。但是这几天的总结下来,我感觉自己还是没有深入到我应该达到深度,在容自己思考两天吧。今天我来聊聊AI吧,今年的AI是绕不过的话题。因为它太热了。接下来我从我自己思考的5个角度来分享这个话题。

AI工具

从openAI发布chatGPT开始,国内国外,大厂小厂,百模大战,千A竞技。着实是让我们这人眼花缭乱。国内是有下:文心一言、讯飞星火、通义千问、盘古、混元等等,国外就更多了:ChatGPT、gemini、Claude、HuggingChat。这是还都是语言生成式大模型,还有很多多模态的大模型产品,比如画画,生成视频,翻译等等,罗列几个top级别的AI工具: midjourney。AI领域绘画。生成效果太逼真了,全程高能有图,未必有真相。 Stable diffusion。可以和midjourney媲美的AI绘图工具。

Runway 文生视频,图生视频领域的独角兽,最新上线的运动笔刷功能,再次让这个工具火出天际。 NotionAI强大的知识管理AI工具。 HeyGen 郭德纲用英文说相声。特朗普说中文看过吗?数字人竟以假乱真,真真假假分不清。 replica studios 领先的语音合成工具,用于电影,视频,广告的使用。

以上这些的我们过去一年能直观感受到的,AI能直接带了生产力的工具,但是和今天讲的AIGC还不一样。AIGC是AI大模型,特别是自然语言处理模型的一种重要应用;ChatGPT则是AIGC在聊天对话场景的一个具体应用。可以把AIGC看作是一个大的范畴,而ChatGPT是其中一个类别的小应用。

AI自动创作生成的内容( AI Generated Content),即AI接收到人下达的任务指令,通过处理人的自然语言,自动生成图片、视频、音频等。打个通俗点的比方,AIGC就像一支马良神笔,拥有的无尽创造力。这支笔的特别之处在于,是由AI打造的。来自AI的理解力、想象力和创作力的加持,它可以根据指定的需求和样式,创作出各种内容:文章、短篇小说、报告、音乐、图像,甚至是视频。AIGC的出现,就像是打开了一个全新的创作世界,为人们提供了无尽的可能性。从用户生成内容(UGC),到专业生成内容(PGC),再到现在的人工智能生成内容(AIGC),我们看到了内容创作方式的巨大变革和进步。

发展AIGC

分享一下2023年我们国家发展AIGC的一些想法,首先就是创新的概念,是AIGC成为普适能力的过程,提供全新方式满足人类的多样需求。简单来说,就是AIGC能够应对各种各样的需求,从而成为一种全新的创新力量。但是创新并不仅仅是技术创新,也包括商业模式的创新和应用场景的创新。内容交流是指AIGC之间的互动,它是通过模型之间的对话和协同工作,实现知识和信息的传递和共享。这个概念强调了AIGC之间的协同合作,使得它们可以共同解决问题,创造新的价值。内容交流不仅包括模型之间的对话,还包括模型与人类用户之间的交互。

  1. 模型选择:在选择模型时,需要考虑其在中文处理、文本输入输出等方面的表现。
  2. 开源社区:扩大中国自己的开源社区,分享是创新的基石。
  3. 产业扩展化:产业上要创造性的使用IAI的能力,提到了在基础模型上进行微调,并通过加入其他逻辑进行应用的开发,形成完整的应用。提到了可能会有的平台,使不同行业的模型能够作为基础能力供用户使用。强调了大模型在实际应用中面临的困难,包括对算力成本和硬件的依赖,以及在垂直行业中表现的挑战。
  4. 模型即服务:讨论了以模型为服务的问题,指出了AI应用开发可能会面临的困难,包括成熟大模型的优化、硬件成本以及在垂直行业中的性能表现。
  5. 训练参与:开放的生态,语料资源是生成优秀大模型的土壤,各方开启共享数据,让基于中文的大模型也能与英语大模型比拼。

AIGC的应用场景有哪些?

AIGC在传媒行业应用:在采集环节,语音识别技术将语音实时转换为文本,压缩稿件生产过程,提高内容生产效率。编辑环节采用AIGC技术进行视频画质修复、增强和智能剪辑,如央视视频在2022冬奥会期间的应用。在播报环节,AI合成主播实现了实时语音和人物动画合成,以文本内容生成自然一致的新闻视频播报。

AIGC在影视行业应用

AIGC在创作阶段通过学习海量剧本生成预定风格的剧本,激发创作者灵感,缩短创作周期。在拍摄阶段,利用人工智能合成虚拟场景,提升视听体验,例如通过实时人员识别与抠图技术将演员融入虚拟场景中。后期制作阶段结合AIGC技术进行视频画质增强,利用“人脸替换”、“人声替换”编辑敏感内容,同时自动剪辑视频片段以缩短制作时间。

AIGC在电商行业应用

在商品展示环节:AIGC生成3D模型用于商品展示和虚拟适用,提升线上购物体验;

在主播打造环节:打造虚拟主播,赋能直播带货;