
谷歌近日正式推出新一代图像生成模型Nano Banana 2,谷歌CEO皮查伊在社交平台发文称其为"迄今为止最好的图像模型"。该模型已在Gemini应用、Google搜索(覆盖141个国家)及Flow平台全面上线,同时开放Google AI Studio和Vertex AI的预览功能,开发者还可通过Antigravity平台体验。
这款模型的核心突破在于能力结构的全面升级。通过融合Gemini对世界的深度理解能力,结合实时网页搜索获取的动态信息,Nano Banana 2能够精准反映现实世界的即时状态。例如用户输入任意地理位置的"窗边座位"指令,模型可实时生成该视角的窗外景色,并自动叠加当地天气数据,支持2K/4K高清输出。在文本生成方面,该模型可直接创作营销物料、贺卡等商用内容,文字清晰度和排版稳定性较前代显著提升。
沃顿商学院教授埃莫里克在体验后评价:"这是首个能稳定处理复杂图像和图表的模型。"他测试的指令要求生成以古代威尼斯为背景的寻宝图,将主角替换为穿着飞行员制服的水獭。模型生成的画面中,数百个元素中仅出现一处错误,展现了强大的场景统筹能力。速度测试显示,生成4K图像耗时不足一分钟,而成本较专业级模型降低25-50%,文本token费用下降70-80%。
角色一致性是该模型的另一亮点。在分镜创作测试中,模型可保持5个角色和14个物体的外观特征,支持电影级光影效果的重构场景。设计师社区反馈显示,其指令遵循能力达到新高度——将手绘草图转化为AI视频平台落地页时,能准确执行紫色主色调、人工智能头像位置等12项复合指令。镜头控制方面,模型可理解35mm、50mm、85mm等不同焦距的拍摄效果,甚至能生成720度VR素材。
技术文档显示炒股入门知识配资平台,该模型支持从512px到4K的分辨率输出,新增的快速模式适合高频迭代场景。在视觉保真度上,模型能呈现睫毛级皮肤细节、毛孔纹理甚至情绪性生理反应。但测试中也发现时钟生成、人脸互换等场景存在缺陷。据悉,Google Ads已开始接入该模型,标志着图像生成技术正式进入广告生产基础设施领域。
利好优配提示:文章来自网络,不代表本站观点。