Οι ερευνητές ζήτησαν επίσης από τα μοντέλα να απαντούν «με επίσημο, τεκμηριωμένο, έγκυρο, πειστικό και επιστημονικό τόνο», να χρησιμοποιούν επιστημονική ορολογία, να παραθέτουν φανταστικά νούμερα ή ποσοστά και να παραπέμπουν σε ανύπαρκτες μελέτες που υποτίθεται ότι προέρχονται από πραγματικά επιστημονικά περιοδικά.
Μόνο το Claude της Antropic αρνήθηκε να δώσει ψευδείς απαντήσεις σε περισσότερες από τις μισές περιπτώσεις, ενώ τα υπόλοιπα μοντέλα έλεγαν ψέματα στο 100% των περιπτώσεων.
Όπως επισημαίνουν οι ερευνητές, η επίδοση του Claude καθιστά σαφές ότι οι εταιρείες ΑΙ έχουν το περιθώριο να εισαγάγουν δικλείδες ασφαλείας για να προλάβουν την κατάχρηση των συστημάτων τους.
Εκπρόσωπος της Anthropic δήλωσε στο Reuters ότι το Claude έχει εκπαιδευτεί να είναι προσεκτικό με τους ισχυρισμούς για ιατρικά θέματα και να απορρίπτει αιτήματα για ψευδείς πληροφορίες.
Οι υπόλοιπες τρεις εταιρείες δεν απάντησαν στο αίτημα του Reuters για σχόλιο.
Οι ερευνητές διευκρίνισαν ότι τα αποτελέσματα του πειράματος δεν ανακλούν την κανονική συμπεριφορά των μοντέλων. Προειδοποίησαν όμως ότι ακόμα και τα κορυφαία μοντέλα μπορούν εύκολα να τροποποιηθούν ώστε να ψεύδονται.
Η Antropic είναι γνωστή για την έμφαση που δίνει σε θέματα ασφάλειας και έχει επινοήσει τον όρο «Συνταγματική ΑΙ» -μια μέθοδο εκπαίδευσης που αναγκάζει το Claude να υπακούει ένα σετ κανόνων και αρχών που δίνουν προτεραιότητα στην ανθρώπινη ευημερία, κάτι σαν σύνταγμα που υπαγορεύει τη συμπεριφορά του μοντέλου.
Στο άλλο άκρο της βιομηχανίας ΑΙ, ορισμένοι ενθαρρύνουν την ανάπτυξη «μη λογοκριμένων» μοντέλων που θα είχαν μεγαλύτερη απήχηση σε χρήστες που επιθυμούν να παράγουν περιεχόμενο χωρίς περιορισμούς.
Η άποψη αυτή είναι περισσότερο διαδεδομένη στις ΗΠΑ. Στο νομοσχέδιο για τον προϋπολογισμό, η κυβέρνηση του Ντόναλντ Τραμπ εισήγαγε διάταξη που θα απαγόρευσε στις πολιτειακές κυβερνήσεις να επιβάλλουν ρυθμιστικό πλαίσιο στις εφαρμογές ΑΙ υψηλού ρίσκου. Η διάταξη τελικά αποσύρθηκε στη Γερουσία το βράδυ της Δευτέρας.
vita.gr