Η Meta παρουσιάζει «αυτοδίδακτο αξιολογητή» Τεχνητής Νοημοσύνης

H ιδιοκτήτρια εταιρεία του Facebook, η Meta, αποδεσμεύει μια σειρά νέων μοντέλων τεχνητής νοημοσύνης από το ερευνητικό της τμήμα, συμπεριλαμβανομένου ενός «αυτοδίδακτου αξιολογητή» που μπορεί να προσφέρει ένα μονοπάτι προς την κατεύθυνση της λιγότερης ανθρώπινης συμμετοχής στη διαδικασία ανάπτυξης της τεχνητής νοημοσύνης.

Η απελευθέρωση ακολουθεί την παρουσίαση του εργαλείου από τη Meta σε ένα έγγραφο του Αυγούστου, το οποίο περιγράφει λεπτομερώς πώς βασίζεται στην ίδια τεχνική «αλυσίδας σκέψης» που χρησιμοποιείται από τα μοντέλα o1 της OpenAI που κυκλοφόρησαν πρόσφατα, για να κάνει αξιόπιστες κρίσεις σχετικά με τις απαντήσεις των μοντέλων.

Η τεχνική αυτή περιλαμβάνει τη διάσπαση πολύπλοκων προβλημάτων σε μικρότερα λογικά βήματα και φαίνεται να βελτιώνει την ακρίβεια των απαντήσεων σε δύσκολα προβλήματα σε θέματα όπως η επιστήμη, η κωδικοποίηση και τα μαθηματικά. Οι ερευνητές της Meta χρησιμοποίησαν αποκλειστικά δεδομένα που δημιουργήθηκαν από την τεχνητή νοημοσύνη για την εκπαίδευση του μοντέλου αξιολόγησης, εξαλείφοντας την ανθρώπινη συμβολή και σε αυτό το στάδιο.

Τεχνητή Νοημοσύνη χωρίς ανθρώπινη παρέμβαση

Η δυνατότητα χρήσης της ΤΝ για την αξιόπιστη αξιολόγηση της ΤΝ προσφέρει μια ματιά σε μια πιθανή πορεία προς τη δημιουργία αυτόνομων πρακτόρων ΤΝ που μπορούν να μαθαίνουν από τα ίδια τους τα λάθη, δήλωσαν στο Reuters δύο από τους ερευνητές της Meta που βρίσκονται πίσω από το έργο. Πολλοί στον τομέα της τεχνητής νοημοσύνης οραματίζονται τέτοιους agents ως ψηφιακούς βοηθούς αρκετά έξυπνους ώστε να εκτελούν ένα ευρύ φάσμα εργασιών χωρίς ανθρώπινη παρέμβαση.

Τα αυτοβελτιούμενα μοντέλα θα μπορούσαν να εξαλείψουν την ανάγκη για μια συχνά δαπανηρή και αναποτελεσματική διαδικασία που χρησιμοποιείται σήμερα και ονομάζεται Ενισχυτική Μάθηση από Ανθρώπινη Ανατροφοδότηση (RLHF), η οποία απαιτεί εισροή από ανθρώπινους σχολιαστές που πρέπει να έχουν εξειδικευμένη εμπειρία για να επισημάνουν με ακρίβεια τα δεδομένα και να επαληθεύσουν ότι οι απαντήσεις σε πολύπλοκα μαθηματικά και γραπτά ερωτήματα είναι σωστές.

«Ελπίζουμε, καθώς η τεχνητή νοημοσύνη γίνεται όλο και πιο υπεράνθρωπη, ότι θα γίνεται όλο και καλύτερη στον έλεγχο της δουλειάς της, ώστε να είναι στην πραγματικότητα καλύτερη από τον μέσο άνθρωπο», δήλωσε ο Τζέισον Γουέστον, ένας από τους ερευνητές. «Η ιδέα της αυτοδιδασκαλίας και της δυνατότητας αυτοαξιολόγησης είναι βασικά ζωτικής σημασίας για την ιδέα να φτάσουμε σε αυτό το είδος του υπεράνθρωπου επιπέδου της τεχνητής νοημοσύνης», είπε.

Άλλες εταιρείες, όπως η Google και η Anthropic, έχουν επίσης δημοσιεύσει έρευνες σχετικά με την έννοια της RLAIF, ή Reinforcement Learning from AI Feedback (Ενισχυτική Μάθηση από Ανατροφοδότηση Τεχνητής Νοημοσύνης). Σε αντίθεση με τη Meta, ωστόσο, οι εταιρείες αυτές τείνουν να μην δίνουν τα μοντέλα τους για δημόσια χρήση.

Άλλα εργαλεία ΤΝ που κυκλοφόρησε η Meta την Παρασκευή περιλάμβαναν μια ενημέρωση του μοντέλου της εταιρείας για την αναγνώριση εικόνων Segment Anything, ένα εργαλείο που επιταχύνει τους χρόνους δημιουργίας απαντήσεων LLM και σύνολα δεδομένων που μπορούν να χρησιμοποιηθούν για να βοηθήσουν στην ανακάλυψη νέων ανόργανων υλικών.

Via

Subscribe to our newsletter!

Tags: AI, Meta