展望未来,我们预计生成性ai的趋势将集中在三个主要领域:快速而广泛的技术进步、比预期更快的数字化转型,以及对人工智能的社会和全球影响的日益重视。具体来说,我们预期生成式ai有8个主要发展趋势:
多模态——即一个生成性ai工具被设计为接受多种格式的输入并生成多种格式的输出——开始成为消费者的首要任务,ai供应商也在注意到这一点。
openai是最早通过gpt-4向用户提供多模态模型访问的公司之一,谷歌的gemini和anthropic的claude 3是紧随其后的几大模型之一。尽管如此,大多数ai公司尚未公开提供多模态模型;即使许多现在提供多模态模型的公司也对可能的输入和输出有重大限制。
在不久的将来,多模态生成性ai可能会变得不再是一个独特的卖点,而是消费者对生成性ai模型的期望,至少在所有付费的llm订阅中是这样。
此外,预计多模态建模本身将变得更复杂、更准确,以满足消费者对一体化工具的需求。这可能看起来像是提高图像和非文本输出的质量,或者为视频、文件附件(正如claude已经做到的)和互联网搜索窗口小部件(正如gemini已经做到的)等增加更好的功能和特性。
chatgpt目前允许用户使用文本(包括代码)、语音和图像输入和输出,但chatgpt中没有内置的视频输入或输出功能。这种情况可能很快就会改变,因为openai正在尝试其新的文本到视频生成工具sora,并可能将其一些功能嵌入到chatgpt中,就像他们对dall-e所做的那样。