Gambar ChatGPT 2: Mengapa OpenAI Membuat Model Gambar Baru Setelah Membunuh Sora

Banyak hal telah berubah dalam industri AI dalam empat bulan sejak OpenAI dirilis Gambar ObrolanGPT 1.5. Kami telah melihat balapan yang panas untuk membangun alat agensebuah kesepakatan yang belum pernah terjadi sebelumnya dengan Pentagon Dan kegagalan AI yang tiada henti.

 

Sekarang, OpenAI kembali ke permainan media generatif. Perusahaan mengumumkan pada hari Selasa bahwa mereka merilis ChatGPT Images 2, model gambar generasi berikutnya.

 

Kiri: iklan AI untuk toko matcha (palsu) di Brooklyn Heights. Kanan: tiruan sampul majalah AI bernama Open SciFi

 

ChatGPT Images 2 dimaksudkan untuk membuat desain penuh teks, seperti pada iklan matcha dan sampul majalah palsu ini.

 

OpenAI/Dikompilasi oleh CNET

Mungkin terasa aneh bahwa OpenAI merilis model gambar baru hanya sebulan setelah mengumumkannya penutupan aplikasi video Sora AI yang pernah viral untuk fokus pada pembangunan “produk inti” yang siap digunakan oleh perusahaan. Namun jelas dari cara model baru ini dibangun bahwa OpenAI tidak mundur dari tujuan tersebut.

ChatGPT Images 2 dirancang untuk menghasilkan gambar berisi teks, termasuk infografis, poster ilmiah, panduan belajar, dan materi pemasaran. Hari-hari video Sora yang aneh Dan Meme yang terinspirasi dari Studio Ghibli sudah berakhir.

Kini, perusahaan tersebut sedang membangun AI yang dapat melakukan apa yang disebutnya sebagai “tugas kreatif yang bernilai ekonomis”.

“Celah dan kasus penggunaan kecerdasan visual semakin meluas, dan kami percaya bahwa hal ini sangat penting bagi visi ChatGPT untuk mengembangkan asisten pribadi Anda, karena asisten kreatif Anda adalah bagian besar dari diri Anda sebagai individu,” Adele Li, pimpinan produk untuk ChatGPT Images, mengatakan kepada wartawan dalam konferensi pers.

(Pengungkapan: Ziff Davis, perusahaan induk CNET, pada bulan April 2025 mengajukan gugatan terhadap OpenAI, menuduh OpenAI melanggar hak cipta Ziff Davis dalam pelatihan dan pengoperasian sistem AI-nya.)

 

Kiri: kartu karakter permainan untuk karakter anime bernama Kenji. Kanan: poster edukasi tentang panda merah

 

Dalam contoh ini, Anda dapat melihat seberapa baik ChatGPT Images 2 dalam merender teks yang dapat dibaca.

 

OpenAI/Dikompilasi oleh CNET

OpenAI telah mengejar memimpikan aplikasi supertoko serba ada untuk segala hal tentang AI, yang dibangun dari platform Codex-nya. ChatGPT Images 2 menghadirkan bagian kreatif dari teka-teki itu.

Model baru ini secara alami meningkatkan tipografi, ikonografi, dan komposisi untuk menghasilkan gambar AI yang lebih profesional. Itu dapat menghasilkan teks dalam berbagai bahasa. Model gambar AI terkenal kesulitan dalam membuat teks yang dapat dibaca dan benar secara faktual. ChatGPT Images 2 adalah model OpenAI terbaik untuk itu. Google sebelumnya meningkatkan rendering teksnya dengan Nano Pisang Protetapi bahkan model “terbaik dari yang terbaik” tersebut kesulitan dalam hal akurasi.

Atlas AI

 

ChatGPT Images 2 kini diluncurkan ke semua pengguna. Batas pembuatan Anda bergantung pada paket Anda: Semakin banyak Anda membayar, semakin banyak gambar AI yang dapat Anda hasilkan.

Pengembang yang menggunakan model di API dapat membuat gambar dalam resolusi 2K dan 4K, meskipun resolusi yang lebih tinggi ini masih dalam versi beta dan mungkin tidak bagus. Pengguna yang membayar juga dapat membuat gambar menggunakan model pemikiran dan penalaran, yang membantu mereka mencari informasi di web, menyusunnya menjadi desain yang mudah dibaca, dan memeriksa ulang pekerjaan mereka.

“Model gambar” sepertinya bukan istilah yang tepat untuk ChatGPT Images 2, meskipun secara teknis benar. ChatGPT tidak menangkap surealisme fantastis dari citra AI seperti Midjourney, atau menawarkan alat pengeditan yang mirip dengan Adobe Firefly.

Tapi ini melayani sekelompok pengguna di tengah spektrum penggemar seni Midjourney dan pencipta profesional Adobe: mereka yang perlu membuat konten yang menarik.

Seperti Antropik Claude Design yang baru dirilisChatGPT Images 2 OpenAI ditujukan untuk pekerja profesional. Guru dapat menggunakannya untuk membuat panduan belajar dan rencana pembelajaran bergambar. Manajer pemasaran dapat membuat postingan media sosial dan aset visual.

Anda dapat membuat hingga delapan gambar dari satu perintah, seperti laporan tiga halaman, yang menjaga konsistensi visual di seluruh gambar.

 

Halaman yang cocok untuk satu resep pai jeruk nipis utama

 

Anda dapat membuat laporan yang lebih panjang dengan Gambar ChatGPT 2, semua halaman cocok.

 

OpenAI/Dikompilasi oleh CNET

 

Halaman yang cocok untuk satu resep pai jeruk nipis utama

 

Ini adalah bagian kedua dari resep pai jeruk nipis yang dihasilkan AI. Perhatikan konsistensi visualnya.

 

OpenAI/Dikompilasi oleh CNET

Salah satu kelemahannya adalah jika Anda ingin mengubah gambar AI, Anda masih perlu membuatnya ulang. Dengan desain yang lebih banyak teks, hal itu kemungkinan besar diperlukan, sehingga Anda akan menghabiskan kredit Anda lebih cepat. OpenAI mengatakan pihaknya fokus untuk mempertahankan alur pengeditan yang berulang dan berbasis cepat agar tetap mudah digunakan.

Prosedur keselamatan OpenAI tidak berubah secara signifikan sejak model gambar terakhirnya. Ini masih menyertakan metadata melalui standar C2PA, sehingga asal gambar AI dapat diidentifikasi. Citra yang kasar dan ilegal masih dilarang dalam kebijakan OpenAI, sebuah pagar pembatas penting yang harus ditegakkan secara efektif oleh perusahaan AI, mengingat contoh-contoh terbaru dari Deepfake yang dihasilkan oleh AI Dan gambaran intim nonkonsensual.

Source link

By Netzone