JAKARTA OpenAI meluncurkan Sora, sebuah model artificial Intelligence (AI) atau kecerdasan buatan yang dapat menghasilkan “pemandangan yang realistik dan imajinatif dari perintah teks”. Model teks ke video ini membuat pengguna dapat membuat video yang fotorealistis berdurasi hingga satu menit berdasarkan petunjuk tertulis.

    Menurut blog perkenalan dari OpenAI, Sora mampu membuat “pemandangan yang kompleks dengan banyak karakter, jenis gerakan tertentu, dan detail subyek dan latar belakang yang akurat”. Perusahaan itu juga mencatat bahwa Sora dapat mengerti bagaimana sebuah obyek “berada di dunia nyata” selain juga “menginterpretasi secara akurat properti dan menghasilkan karakter yang menarik yang menunjukkan ekspresi yang nyata”.

    Model ini juga dapat menghasilkan video berdasarkan foto, juga dapat mengisi frame yang hilang dalam sebuah video, atau memperpanjangnya.

    Beberapa demo video yang dihasilkan Sora ditampilkan dalam post blog OpenAI di antarnya memperlihatkan pemandangan dari California pada masa demam emas pada pertengahan abad ke-19, sebuah video yang tampak seperti direkam dari dalam kereta di Tokyo, dan beberapa video lainnya.

    Dilansir The Verge, beberapa video demo ini menunjukkan tanda-tanda bahwa mereka dibuat oleh AI, seperti adanya lantai yang bergerak dalam video tentang museum dan sejumlah contoh lainnya, meski secara keseluruhan hasil video tersebut sangat mengesankan. Terkait hal ini, OpenAI mengatakan bahwa Sora mungkin “kesulitan mensimulasikan dengan akurat fisika dari sebuah pemandangan yang kompleks”. 



    Follow Berita Okezone di Google News


    Dapatkan berita up to date dengan semua berita terkini dari Okezone hanya dengan satu akun di
    ORION, daftar sekarang dengan
    klik disini
    dan nantikan kejutan menarik lainnya

    Sora dapat menghasilkan video dengan resolusi hingga 1920×1080, dan hingga 1080×1920. Model ini juga dapat menangani genre dan tema yang berbeda, seperti fantasi, fiksi ilmiah, horor, komedi, dan banyak lagi.

    Sora didasarkan pada deep neural networks (jaringan saraf dalam), yang merupakan jenis model pembelajaran mesin yang dapat belajar dari data dan melakukan tugas-tugas kompleks. Sora menggunakan kumpulan data besar video yang telah dipelajarinya, mencakup berbagai topik, gaya, dan genre.

    Model AI ini menganalisis teks prompt dan mengekstrak kata kunci yang relevan, seperti subjek, tindakan, lokasi, waktu, dan suasana hati. Kemudian mencari video yang paling sesuai dari kumpulan datanya yang cocok dengan kata kunci, dan menggabungkannya untuk membuat video baru.

    Sora juga menggunakan teknik yang disebut transfer gaya, yang memungkinkannya mengubah tampilan dan nuansa video sesuai preferensi pengguna. Misalnya, jika pengguna menginginkan video dengan gaya sinematik, direkam pada film 35mm, dan dengan warna cerah, Sora dapat menerapkan efek tersebut pada video, mengubah pencahayaan, warna, dan sudut kamera.

    Saat ini Sora hanya tersedia bagi “red teamers” yang memeriksa model AI ini dari potensi bahaya dan risiko. OpenAI juga memberikan akses Sora pada beberapa seniman visual, desainer, dan pembuat film untuk mendapatkan umpan balik (feedback).



    Source link

    Share.