GPT-4: "Ανθρώπινες επιδόσεις" για την τελευταία έκδοση του GPT

H OpenAI αποκαλύπτει τις “Ανθρώπινες Επιδόσεις” του GPT-4 που πέτυχε στην εξέταση Bar επίδοση στο 10% των κορυφαίων.

Η προηγούμενη έκδοση, GPT-3.5, σημείωσε περίπου το χαμηλότερο 10% μιας προσομοιωμένης εξέτασης Βar.

Το GPT-4 (Generative Pretrained Transformer 4) είναι σε θέση να χειρίζεται περισσότερες λεπτομερείς οδηγίες από το GPT-3.5, σύμφωνα με την OpenAI. Επιπλέον, το GPT-4 θεωρείται ασφαλέστερο και ακριβέστερο.

Το OpenAI αποκάλυψε ότι το GPT-4, η πιο πρόσφατη έκδοση του βασικού μοντέλου κύριας γλώσσας, παρουσιάζει «ανθρώπινη επίδοση» σε διάφορα επαγγελματικά και ακαδημαϊκά τεστ, συμπεριλαμβανομένης της επιτυχίας σε μια προσομοίωση δικηγορικής εξέτασης στο κορυφαίο 10% των εξεταζομένων.

Ανθρώπινες επιδόσεις στις εξετάσεις για τo GPT-4

Η αναβάθμιση είναι μια τεράστια βελτίωση σε σχέση με το GPT-3.5, το οποίο σημείωσε επίδοση περίπου στο χαμηλότερο 10%, αναφέρει η OpenAI σε ανακοίνωσή της.

Το GPT-4, το οποίο μαθαίνει τις δεξιότητές του αναλύοντας τεράστιες ποσότητες δεδομένων που συλλέγονται από το Διαδίκτυο, σχεδιάστηκε για να τροφοδοτεί chatbot τεχνητής νοημοσύνης, όπως το AI chat του Bing και το ChatGPT της OpenAI, καθώς και διάφορα άλλα συστήματα, από επιχειρηματικό λογισμικό μέχρι προσωπικούς διαδικτυακούς εκπαιδευτές.

Η OpenAI αναφέρει ότι το νέο μοντέλο είναι «πιο δημιουργικό και συνεργατικό από ποτέ» και «μπορεί να λύσει δύσκολα προβλήματα με μεγαλύτερη ακρίβεια, χάρη στις ευρύτερες γενικές του γνώσεις και τις ικανότητες επίλυσης προβλημάτων».

“Η διαφορά προκύπτει όταν η πολυπλοκότητα της εργασίας φτάσει σε ένα επαρκές όριο”, γράφει η OpenAI. “Το GPT-4 είναι πιο αξιόπιστο, δημιουργικό και ικανό να χειρίζεται πολύ πιο σύνθετες οδηγίες από το GPT-3.5.”

Εκτός από την προσομοιωμένη εξέταση Bar, το GPT-4 πέτυχε επίσης καλύτερα από τους ανθρώπους σε άλλα τυποποιημένα τεστ, αποδίδοντας 93 στα 100 σε εξέταση ανάγνωσης SAT και 89 στα 100 στην εξέταση SAT MathI.

Επιπλέον, το GPT-4 μπορεί να δεχτεί εισαγωγή κειμένου και εικόνας, αν και μπορεί να ανταποκριθεί μόνο μέσω κειμένου, σύμφωνα με την εταιρεία τεχνολογίας OpenAI.

Η OpenAI είπε ότι χρησιμοποίησε το Microsoft Azure για να εκπαιδεύσει το μοντέλο, το οποίο βγήκε ως “άνευ προηγουμένου σταθερό” κατά τη διάρκεια της εκπαίδευσής του. Η Microsoft έχει επενδύσει δισεκατομμύρια δολάρια στην έρευνα του OpenAI από το 2019.

Το GPT-4 θεωρείται ασφαλέστερο και ακριβέστερο καθώς είναι 82% λιγότερο πιθανό από το GPT-3.5 να ανταποκριθεί σε αιτήματα για περιεχόμενο που το OpenAI δεν επιτρέπει. Η τεχνολογία ανταποκρίνεται επίσης σε ευαίσθητα αιτήματα όπως ιατρικές συμβουλές και αυτοτραυματισμό, σύμφωνα με τις πολιτικές του OpenAI, 29% συχνότερα.

To GTP-4 δεν είναι ικανότερο από τον άνθρωπο

Ωστόσο, το GPT-4 δεν είναι ακόμα τέλειο και είναι λιγότερο ικανό από τους ανθρώπους σε πολλά σενάρια πραγματικού κόσμου. Η OpenAI προειδοποίησε ότι εξακολουθεί να έχει την τάση να δημιουργεί πληροφορίες (ή να “παραισθάνεται”), είναι επιρρεπές στο να επιμένει ότι είναι σωστό όταν δεν είναι ενώ έχει την ικανότητα να δημιουργεί βίαιο και επιβλαβές κείμενο όπως η προηγούμενη έκδοση.

«Το GPT-4 εξακολουθεί να έχει πολλούς γνωστούς περιορισμούς τους οποίους εργαζόμαστε για να αντιμετωπίσουμε, όπως κοινωνικές προκαταλήψεις, παραισθήσεις και αντίθετες προτροπές», δήλωσε η OpenAI.

Περιεχόμενο που παραβιάζει τις οδηγίες χρήσης εξακολουθεί να είναι δυνατό λόγω “jailbreak” και κακόβουλων μηνυμάτων.

«Καθώς αυξάνεται ο “κίνδυνος ανά σύμβολο” των συστημάτων τεχνητής νοημοσύνης, θα καταστεί κρίσιμο να επιτευχθούν εξαιρετικά υψηλοί βαθμοί αξιοπιστίας σε αυτές τις παρεμβάσεις. Προς το παρόν είναι σημαντικό να συμπληρωθούν αυτοί οι περιορισμοί με τεχνικές ασφάλειας κατά την ανάπτυξη, όπως η παρακολούθηση για κατάχρηση», καταλήγει η OpenAI.

Tags: AI, OpenAI

GPT-4: “Ανθρώπινες επιδόσεις” για την τελευταία έκδοση του GPT

Διαβάστε ακόμη:

Ανθρώπινες επιδόσεις στις εξετάσεις για τo GPT-4

To GTP-4 δεν είναι ικανότερο από τον άνθρωπο