国产成人在线 GPT-4o何如抢了Midjourney的饭碗

国产成人在线

2025 年 3 月 26 日，OpenAI 凌晨官宣，GPT-4o 的原生多模态图像生告捷能进展上线。用户不再需要登录 OpenAI 的文生图模子 DALL-E，不错成功在 ChatGPT 期骗里调用 4o 生成、修改图片。

整夜之间，AI 生成的吉卜力争像在 X 等应对媒体上疯传，互联网被一场和睦的二次元画风海浪归并。东说念主们上传自拍照，输入"吉卜力作风"，几秒后，宫崎骏动画中的唯好意思与黑甜乡便流淌在发丝衣角间，以致连 OpenAI 独创东说念主奥特曼也晒出我方的吉卜力头像，为这场飞扬添了一把火。

不外，吉卜力的火爆仅仅其一，更关节的是，GPT-4o 的绘图才调出圈冲突了文生图鸿沟的固有模式，以 Midjourney 等垂类期骗为首的赛说念第一次遭到了大模子的挑战。

蓝本，东说念主们用 Midjourney 生图时，仍靠近着一个致命问题：迅速性太强，在指示词过于复杂的时分，细节归附度就会权贵镌汰，而 GPT-4o 控图才调的跃升，让东说念主类第一次感受到了与 AI 艺术家在多轮对话中精确改图的魔力。

那么，一个东说念主类印象里只会聊天的通用大模子 GPT-4o，是怎样赶超文生图鸿沟专科选手 Midjourney 的呢？

实践上，肖似 Midjourney 一样的期骗早在一年前就能生成吉卜力、赛博一又克、超现实等多种作风的图像，以致在画面缜密感、解析力上略胜于 GPT-4o。但 GPT-4o 的贤慧之处在于，它莫得选拔正面硬刚其艺术鸿沟的生图质料，而是在期骗门槛、修图改图、跨学科才调等细分赛说念弯说念超车。

一是当然讲话对话才调的提高大大镌汰了使用门槛。传统文生图鸿沟，用户必须掌捏一套复杂的结构化指示指示，比如作风、镜头、色调、角度、布景、主体等，差之豪厘、谬以沉。而 GPT-4o 不错精确理解当然讲话敕令，只需要像跟好友一样交流，张嘴绘制成为现实。

当然讲话等于大口语，日常生存中的理论语。比如，如若你需要一张瀑布图，只需要告诉 GPT-4o，"帮我生成一幅朝晨繁密丛林里的彩虹瀑布"就不错了。但面对 Midjourney 就需要像下图一般，用高度结构化的 prompt 指示告诉它：这个图像的主体有什么，布景是什么样式，仰角、俯角如故平视，作风是油画、古典或者赛博一又克，需要细分到这种进程才可能达到理思后果，但就算分得这样细了，依然会有一些无关蹙迫的画面元素跳出来画虎不成。

二是多模态才调带来的图生图、图改图功能的上线。肖似 Midjourney 一样的期骗只可发翰墨指示，不撑持上传一张图片再作念修改，或者说不撑持 AI 生图后，再调遣图像的远离率、色调、布景。如若成图后果不睬思，只可回到第一步重写指示词碰气运，之前生成的图像等同作废。

GPT-4o 的强悍就在于用户不错随性上传一张图片屡次修改，不错是 AI 生成的，也不错是我方拍的。比如，你不错上传一张全身照，把头型换成大波浪，把衣着换成购物车里的裙子看上死后果。它撑持在现存的图片上去 p 图去修改，荒谬于咱们无用学习 PS 这种具有高壁垒性质的修图本领。

更牛的是它还不错多轮对话，撑持在原图上不限次数地一直改，直到安闲为止。你不错须臾改一个头发，须臾把布景换成沙漠，或者须臾调遣滤镜作风。只有你思，它便欢快。

国产成人在线

图源：小红书 @Mr. 汤先森

除了交互门槛的镌汰和控图才调的提高，GPT-4o 的跨学科常识储备也让东说念主惊艳。集成了大讲话模子原有常识库的 GPT-4o 荒谬于一个知天文、晓地舆的画家，不仅能解高数、作念物理题，归附勾引草图也不在话下。比较之下，Midjourney 四肢垂类期骗永恒局限在艺术鸿沟里，为电影宣发、告白等文娱产业作事。

GPT-4o 有多牛？给一个题目就不错生成函数图像，荒谬于一款绘制疏导版的拍照搜题期骗。以致于你给他一个莫得任何色调的铅笔画勾引草图，它齐能生成出施工后的房屋实景，扫数卓绝了学科的规模，是一个文理双全的万能型选手。

一本道

图源：小红书 @云安

既然 GPT-4o 生图改图功能如斯惊艳，咱们就要提问了，在其火爆出圈背后，能够为闲居东说念主带来什么实践价值呢？

就在其上线一周内，Midjourney CEO 大卫 · 霍尔兹坐不住了，发文称：GPT-4o 仅仅花架子，Midjourney-v7 下周上线。

GPT-4o 和 Midjourney 孰优孰劣，当前还难以定论。但能够细认识是，GPT-4o 火出圈了，它冲出了磋磨师这个小众的圈子，走入了大多量东说念主的责任场景里，就算扫数不知说念 AI 生图是什么，但一定也知说念应对媒体上倏得冒出一个能用嘴 P 图的相聚器具。

那么，GPT-4o 为什么这样火，给咱们带来的一个最实践的价值点在那儿？

领先，它果真作念到了期骗零门槛，用户以致不需要任何艺术功底和 AI 基础，毫无基础的闲居东说念主也能成功上手。用 Midjourney，你必应知说念一些基本的家数、色调、光学、框架等绘画常识以及 /imagine（生成图像）、--ar（图像宽高比）等基础英文指示指示。但用 GPT-4o，你也不错不懂透视、框架、色泽，也不需要知说念什么是结构化指示词，扫数无用任何专科基础，就像跟一又友对话一般交流就不错修图。

图源：小红书 @Geek4Fun

除了使用门槛镌汰，模子产物的质料和服从也大幅提高。一是生图更快，曩昔用 Midjourney 解析复杂指示需要 1min 把握，GPT-4o 在 20s 内就不错归附。

第二，生图和改图的截至性提高了，GPT-4o 能够扫数归附你给它的指示。比如雷同的一个指示"给我生成一个猫猫和狗狗在草地里玩耍的场景"，GPT-4o 生成的等于一只猫和一只狗在草地上玩，莫得任何其他会倏得冒出的元素，但 Midjourney 可能在草坪上多一个公园或勾引，不会扫数按指示来。粗拙地讲，等于 GPT-4o 更能听你的东说念主话了，它就像你的电子仆东说念主一样，你让他干嘛，他就干嘛，过剩的事一件不作念，该作念的事也毫不少干，精确度更强了。

由此，GPT-4o 绽开全民赛说念，参预到咱们责任场景里。之前，闲居用户用 Midjourney 更多如故出于兴味，文娱属性强、器具属性弱。生成的油画、动漫等多样作风的图像虽雅瞻念，但既不可提高责任效率，也不可赢利，主要起到了一个造型上的作用。

再比如电商行业的宣传海报，甲方需要你生成一个针对西洋商场的英语海报，其中磋磨元素和讲话齐需要作念土产货化润色。之前的历程是对接磋磨师修改元素、去翻译软件润色，再导入 PS 软件修改，费时困难。但当前 GPT-4o 只需要一句话，"把这张海报改成西洋风，讲话造成英语"，它就很快就能磋磨一张合乎条目的海报，跨鸿沟跨学科的集成才调相称强悍。

聊完 GPT-4o 的绘制出圈，不如再聊聊，GPT-4o 四肢一种底层模子还有什么可挖掘的处所。

咱们齐知说念，Midjourney 是一个架构在模子上的期骗，但 GPT-4o 自己等于一个模子，生图是它的才调之一。2022 年刚出说念的 ChatGPT 仅仅一个能够翰墨交流的对话助手，自后不错语音打电话，当前又能绘制，一直不时在不同维度上迭代升级。

而这次 GPT-4o 能绘图赛说念杰出重围，真要感谢其原生多模态模子才调的大幅流露。跟 Midjourney 不一样，GPT-4o 有更多本领略径可走。当前文生图鸿沟期骗宽敞用的底层模子叫扩散模子 diffusion model，旨趣是先生成一个约略的图像，再摒除噪点，就像雪中作画、若明若暗，归附才调不彊。而 GPT-4o 沿用文生图自转头模子，荒谬于把之前预计 token 的逻辑推理才调进一步延迟到了文生图鸿沟，通过逐帧绘制的格式，从已生成的像素估量下一个像素，本体是效法东说念主类画画。这意味着，与垂类期骗不同，大模子不错从底层架构上选拔不同的本领略径，而架构的升级频繁会带来性能的跃升，基于 GPT-4o 等原生模子的功能有更多的生漫空间。

第二个是，多模态会通会带来跨鸿沟的会通领略，GPT-4o 四肢一种通用大模子，领有整合翰墨、音频、图像等不同门径信息的才调，现阶段依然不错打电话、生图改图了。而在将来，是不是不错成功生成音乐和视频，也值得期待。实践上，GPT-4o 本次上线的生图功能就脱胎于 OpenAI 的文生图模子 DALL-E。无意，OpenAI 旗下的文生视频模子 Sora 也可能通过某种本领被整合到 GPT 模子里。届时，在一个模子里交叉措置多种模态的信息将不再远方。

简言之，GPT-4o 绘图才调的出圈让咱们看到了底层大模子集成多期骗的才调。而从这个才调生息出的愿景是，咱们将来不错在一个一站式的模子内部同期使用绘画、音乐、代码等多维才调。何况，它的使用门槛是相称低的，低到任何一个毫无本领基础，以致连 AI 齐不了解的东说念主齐能用。

而这无意才是东说念主类发明 AI 的终极计算——让本领普惠到每一个边缘。

国产成人在线

国产成人在线 GPT-4o何如抢了Midjourney的饭碗

热点资讯

相关资讯

国产 成人 在线 GPT-4o何如抢了Midjourney的饭碗

热点资讯

相关资讯

国产成人在线 GPT-4o何如抢了Midjourney的饭碗