Το GPT-4o αποκτά ενσωματωμένη δυνατότητα δημιουργίας εικόνας με πρωτοφανή ακρίβεια και ευελιξία
Μια από τις βασικές καινοτομίες είναι η επαναληπτική δημιουργία μέσω διαλόγου, όπου ο χρήστης μπορεί να βελτιώνει την εικόνα με φυσικό τρόπο μέσα από συνομιλία, κρατώντας σταθερά χαρακτηριστικά μεταξύ διαφορετικών εκδοχών. Το GPT‑4o επίσης ξεχωρίζει στην απόδοση κειμένου μέσα στην εικόνα και στον χειρισμό πολλαπλών αντικειμένων με σαφείς ιδιότητες—ξεπερνώντας τους περιορισμούς προηγούμενων μοντέλων που τα έβρισκαν δύσκολα με περισσότερα από 5–8 στοιχεία.
Ωστόσο, η OpenAI αναγνωρίζει πολλαπλούς περιορισμούς στο σύστημα. Αυτοί περιλαμβάνουν προβλήματα περικοπής (cropping), λανθασμένες αποδόσεις (hallucinations), δυσκολία στην απόδοση μικρού και πυκνού κειμένου, περιορισμένη ακρίβεια σε γραφήματα, και προκλήσεις στην επεξεργασία πολύγλωσσου κειμένου. Η λεπτομερής επεξεργασία και οι συνθέσεις με πολλές πληροφορίες παραμένουν τεχνικά δύσκολες.
Η OpenAI υποστηρίζει ότι όλα τα παραγόμενα γραφικά φέρουν μεταδεδομένα C2PA για σκοπούς ιχνηλασιμότητας, ενώ εφαρμόζει αυστηρές πολιτικές ασφάλειας: μπλοκάρονται αιτήματα που σχετίζονται με παιδική κακοποίηση, deepfakes ή περιεχόμενο με πραγματικά πρόσωπα σε μη αποδεκτά πλαίσια. Η ασφάλεια ελέγχεται με τη βοήθεια ενός δεύτερου LLM που έχει εκπαιδευτεί για την κατανόηση πολιτικών και πιθανών ασαφειών.
Η λειτουργία είναι ήδη διαθέσιμη στους χρήστες των εκδόσεων Free, Plus, Pro και Team, ενώ θα ακολουθήσει υποστήριξη για Enterprise και Edu, καθώς και μέσω API για developers. Η OpenAI επισημαίνει ότι η δημιουργία εικόνας απαιτεί περισσότερο χρόνο επεξεργασίας – περίπου ένα λεπτό ανά εικόνα – λόγω της αυξημένης λεπτομέρειας.
Η ενσωμάτωση αυτής της λειτουργίας μετατρέπει τη δημιουργία εικόνας από αισθητικό εντυπωσιασμό σε ένα εργαλείο υψηλής χρησιμότητας, χωρίς όμως να κρύβει τις τεχνολογικές και δεοντολογικές προκλήσεις που τη συνοδεύουν.
478