人都搞不懂人,还指望机器懂人?科学家都无法预测科技的发展,还指望资本家能预测未来?世界从来没有主宰者,万物皆刍狗!
8、 Morgan Stanley:ChatGPT: What is it? Why it Matters? Is it a Google Threat...and Broader Industry Implications
我一个大专文凭看这个994有游戏七杀网页游戏,是不是太飘了AI网页设计代码游戏app
就像清华教授钱颖一曾经说的,未来人工智能在知识层面会做的很好,但“大学教育的价值不在于记住很多事实,而是训练大脑会思考。”
但在可以想见的未来,当游戏制作时,把游戏中的每一个人物都设计一个AI模型,那将是AIGC深度开发的巨大潜力与机会,制作出真正沉浸感的新游戏。
当然,当下的AI游戏大多数还是基于文本,所以其互动效果类似ChatGPT,事实上这块能力也是基于OpenAI的语言模型构建的。不同点在于游戏版会更具逻辑性,也能够保留对过去交互的记忆,并且是基于大的故事背景而做出的互动。
AI Dungeon代表了ChatGPT对游戏行业可能的颠覆性。当AI应用于游戏,游戏里的剧情将变得不可预测,而是会根据每个用户的选择,形成无限的可能性。并且游戏里的NPC都可以有各自的“生活”,或是影响游戏结局,从而给玩家带来独特的体验。
AI Dungeon是一个由AI驱动的基于文本的RPG游戏,也可以说是由AI驱动剧情发展的游戏。通过AI应用,用户可以在能想象到的任何场景中,去进行角色扮演编写故事,与其他人物互动。
当然,快速记录信息只是最开始的第一步,Mem如何将信息数据从其他平台快速同步整合到Mem上更为重要。Mem在背后形成了一个知识图谱,由一个个Node(节点)组成,每个节点都是一个Entity,这个Entity可以是一条Mem(笔记),也可以是某个具体的日程活动、一个联系人信息或者是一条任务等等。Mem会通过AI将这些不同节点上的Entity进行分析和连接,比如你在一条笔记中提到了某位朋友推荐的一家餐馆,这两个信息点都会在知识图谱中进行分析和归类,并自动形成关联,当外部条件触发时,这些信息就会自动呈现在用户的面前。
在工作流程上,Mem主打快速记录与内容搜索,围绕搜索和按时间顺序排列的时间线,可以附加主题标签,标记其他用户,并为笔记添加循环提醒信息。
简单来说,Mem像是一种整合个人信息数据的工具,将你的个人邮件、日历活动和笔记信息等自动汇集到一起,并利用AI来自动整合这些信息,并在特定的时间点上给你所需要的。
Mem由华裔工程师Dennis Xu和Kevin Moody共同创办,他们曾表示,Mem与传统记事应用程序的不同之处在于它的“轻量级”。
Mem是一款专注于工作的应用程序,可以利用AI自动组织笔记。Mem也是OpenAI领投的,投资金额为2350万美元,投资后估值为1.1亿美元。
“这就像有一个小机器人坐在你的肩膀上,你们坐在桌子的同一侧,目视同样的东西,当这个机器人可以‘出手’的时候,它会自动为你提供帮助。……最近一项研究的统计数据非常有趣,该研究要求程序员从头开始编写Web服务器代码,程序员在使用Copilot的情况下完成这一任务的速度要比不使用Copilot快50%以上。然后,我们从遥测中得知,在启用这一功能的情况下,在程序员编写新代码的过程中,例如Python 等流行编码语言中,Copilot为程序员编写了多达40%的代码。这是个了不起的成就。”
在底层技术方面,GitHub Copilot就是基于OpenAI的文本生成技术。曾经有GitHub Copilot高管对其描述是:
然后只要用户给出提示,GitHub Copilot就可以根据上下文自动编写完整的函数,或实现完整的功能,包括docstrings、注释、函数名、代码。
GitHub Copilot支持的编程语言包括Python、JavaScript、TypeScript、Java、Ruby和Go。有了GitHub Copilot,软件开发人员可以在编辑器中使用内联注释来获取JavaScript、Python、TypeScript和Ruby等编程语言的代码建议。
GitHub Copilot是微软旗下代码托管平台GitHub推出的AI编程工具,Copilot的主要定位是提供代码补全与建议功能,可根据当前文件的内容和光标位置自动生成代码。
第三是通过AI自动删除语气词或是重复的短句。剪辑过音频的朋友都知道,我们日常说话时其实会有大量的语气词或是重复词,说的时候没感觉,但在听录音的时候非常明显。但这种剪辑很麻烦,需要一点一点去*。如今通过AI自动处理,很方便也令音视频更加专业。另外就是字幕处理,Descript会根据上下文自动调整字幕的停顿断句,也会自动补充各种日常习惯语法。
第二个好用的功能是语音克隆,也就是用户先录好一段声音后,后续只需要写文本就能实现整个录制,AI会用克隆好的声音自动录制出来。也可以选择其模版库里的其它声音模版。当你对文本进行修改,录音也会自动调整。
Descript首先第一个打破的,就是传统编辑器中的时间轴概念,以期在不触及时间轴的情况下完成各种新的操作,可能是对视频中的每个画面利用AI做更多操作,例如删除视频里面的背景,添加新画面等等。
去年11月,Descript宣布了5000万美金的融资,这一轮由OpenAI旗下的OpenAI Startup Fund领投。
这些AI生成的照片风格各异,有动漫效果、科幻色彩、水彩感、或是油画风格等等,一下子形成了病毒式传播。此外,这是一个完全付费的产品,生成的这50/100/200张的价格分别为3.99/5.99/7.99美元。
由此也可以看出Stability AI的野心,它并未聚焦于某个单一场景,而是通过开源来拓展场景,再去寻找具体的商业模式。当然,更大的想象空间,也需要更多的投入,所以Stability AI在种子轮就拿了这么多钱。
Stability AI在训练自己的模型时,也花费了很高的成本。根据Business Insider的报道,Stability AI目前拥有一个,在AWS中运行的由4000多个Nvidia A100 GPU组成的芯片集*,用于训练Stability的各个AI模型,这导致其在运营和云服务方面的支出超过了5000万美元。AI公司在训练方面的确耗资巨大,此前微软对OpenAI的10亿美元投资,其中一半是用云计算等服务折算的。
Stability AI是一项开源技术,用户可以在其代码的基础上构建与设计、电影、增强现实、视频游戏、广告甚至电子商务相关的应用程序。通过这套开源技术,Stability AI的社区已经创造出了几乎涵盖所有媒体内容形态的AI模型,包括图像、语言、音频、视频以及3D内容。
Stability AI也在去年10月宣布完成了1.01亿美金的种子轮融资,估值达10亿美金,Stability AI成立仅2年时间。
这些进步,得益于生成扩散模型和多模态预训练模型等技术的快速发展,在图文生成效果上有了显著进步,让AI可以快速、灵活地生成不同模态的数据内容。
扎哈·哈迪德建筑伦敦工作室的计算研究小组(ZHACODE)设计师Tim Fu,使用Midjourney设计的钢琴家的住宅:
基于这个概念图像进行简单的3D建模后,库拉斯将这些模型的图像反馈给Midjourney,并令其迭代建筑图纸。然后就得到了这个展馆的建筑图纸,虽然还缺乏细节。
建筑师也在使用来寻找灵感。例如芝加哥建筑师斯蒂芬·库拉斯(Stephen Coorlas)使用Midjourney为芝加哥北岸地区设计的露天展馆。
这些问题都可独立,也可搭配在一起,看你想让AI画到什么程度。描述的越多,AI会以自己的理解,按权重优先级进行绘制;而如果描述的少,AI也会根据自己的理解绘画,也许能给出惊喜的创意。
以及《空间歌剧院》,在美国科罗拉多州博览会上获得一等奖,随后其作者Jason Allen才透露,这幅作品是出自Midjourney AI之手。
Podcast.ai所采用的Play.ht,是一个AI文本转换语音生成器,模型覆盖了数千种说话的声音,还可以学习人类的情感、说话语气以及笑声等。从文本语言模型到音频语言模型时,音频数据速率增高是一个大难题,一个句子的几十个字符用音频波形表达,所包含的数值往往多达数十万个。此外,由于文本和音频之间的一对多关系,也即是一个语句可以有不同的说话风格、情感等,这也成为了语音模型研究中需要解决的问题。
在这段20分钟的对话里,乔布斯“死而复生”,与Joe Rogan讨论了关于曾经的大学时光、对计算机的看法、工作状态以及信仰等等。
Podcast.ai的第一期节目引爆全网,Podcast.ai通过乔布斯的传记,和收集网络上关于他的所有录音,用Play.ht的语言模型大量训练,最终生成了一段美国知名播客主持人Joe Rogan采访乔布斯的播客内容。在这期播客里,乔布斯的各种语音、语调都模拟的非常相似。
对于用户来说,只需要输入标题和简单的几句话介绍来描述需求,例如根据内容发布平台的调性,来选择文章的调性。如果有语法错误,还可以通过另一款应用Grammarly来自动修改。
Copy.ai也引入了人工修正,不断训练出更优秀的人工智能模型。Copy.ai的核心目标不是完全取代人工,而是通过AI的建议,将人类创作文案的构思阶段缩短80%,营销人员用自己的创造力来填补剩余的20%。Copy.ai提供了大量的场景模版,几乎涵盖了市场营销需要文案的所有场景。
除了文字内容外,Jasper也推出了AI绘图产品Jasper Art,与其他热门产品类似,也是用户输入图片描述,AI会自动生成图片。当然Jasper 的定位会更偏向市场营销应用设计。
作为 AIGC 圈新贵,Jasper AI已经不是一个陌生的名字。在去年10月,Jasper AI就宣布了以15亿美元估值的A轮融资,而Jasper AI的产品上线也就18个月时间。
现在,已经有一些新老玩家,在使用已经训练好的基础模型,然后再基于这些模型进一步优化,例如GitHub的Copilot功能,以及Notion的协助功能,都是基于OpenAI的相关模型开发而来。随着模型不断被AI应用平台使用,下一步就是训练数据,甚至整个业务逻辑。新老玩家们,未来可能会在一些领域激烈竞争。
而在新玩家中,涌现了一批AI绘画、AI编程、各类自动化工具等等方向的创新项目,类似当年移动互联网,这些新方向也有可能诞生一批优秀的新公司。
4、重构“AI应用”?此外,在Sam Altman所说的应用中间层之上,在AI应用端本身,是否存在一个重构当下App的机遇?是现有玩家往AI转型,还是会涌现新玩家,这个问题也值得持续观察,还未达成市场共识。
3、应用中间层:在大模型的基础上,不同垂直领域会有各自的特殊情况,比如医疗、司法等等领域,这些特定领域的数据本身也是稀缺的。创业公司可以扎根各自的垂直领域,基于特定的数据集+行业knowhow,形成各自的商业化路径,并保护用户数据和隐私。
2、模型层:大公司负责训练基础大模型,这种基础能力可能会逐渐走向开放。一种可能是,最终形成类似iOS 和Android两大阵营,或是类似云计算的格局,一般这种量级的生态圈最终不会容纳太多家,但也不会被一家垄断。目前来看微软(OpenAI拔得头筹)vs谷歌(旗下有Deepmind)已经开战,但巨头的基础模型之间是否会形成差异?以及会形成怎样的差异性?这个问题也值得观察。但无论如何,这将会是继移动互联网之后,下一个史诗级的重大战略窗口,中国公司也需要积极加入战局。
将来承担模型训练角色的应该不会是初创公司,但这些企业可以在上述的中间层角色中发挥巨大价值。我认为中间那一层会创造很多价值。”
他们所做的 1% 的训练,对于应用来说至关重要。我认为,这些创业公司将会非常成功,并且与众不同。可能包括一段时间内存在的 prompt engineering(提示工程)或基础核心模型(core base model)。
创业公司会训练自己的模型,只不过不是从头开始。他们将采用基础模型,这些模型已经经过大量的计算和数据训练三国志张飞传游戏单机版,然后在这些模型之上进行训练,为每个垂类创建模型。
我认为,将来在基础模型和具体AI应用研发之间会有一个中间层:出现一批专门负责调整大型模型以适应具体AI应用需求的初创企业。能做好这一点的初创公司将会非常成功,但这取决于它们能在「数据飞轮」上走多远。
“将来应该会出现几个大型的基础模型,开发人员都将基于这些基础模型研发AI应用。但目前的情况依然是某一家公司开发出一个大型语言模型,然后开放API供他人使用。
对于AI的发展来说,工程的重要性不亚于科学,创建一个迭代反馈的闭环至关重要。这也将是后来者,赶超ChatGPT的重要难点。
以前,小模型的人工智能中,其实包含了若干Agent(类似于执行具体任务的程序),一个专门负责聊天对话、一个专门负责诗词生成、一个专门负责代码生成、一个专门负责营销文案等等,如果想添加新功能,可以去训练新Agent。一旦用户的问题超出了这个范围,人工智能就会变成人工智障。
最近几乎所有大型人工智能的前沿突破,都来自巨头公司,因为他们拥有强大的资金和算力。ChatGPT与上一波人工智能产品苹果Siri、微软小冰的核心不同是,过去都是小模型,而如今是真正的大模型。
每隔一段时间,一项技术就会捕获全世界的想象力。从硅谷、华尔街、中关村、到世界各个角落的办公室和大学教室,人们都在热烈地讨论ChatGPT及人工智能的未来。
我用AI做了一款一刀999的2.5D网页游戏?
实时AI驱动的网页游戏开发
专题: 单机游戏三国草 单机三国曹游戏 单机游戏三国的上一篇网页游戏名字王者伤感昵称
下一篇漂亮网页游戏推荐免费皇帝