Εταιρείες ΤΝ αναζητούν δεδομένα που παράγονται από ΤΝ για αναδρομική εκπαίδευση

Από astrolabos

Ιούλιος 21, 2023
Από astrolabos • Ιούλιος 21, 2023

Εταιρείες ΤΝ αναζητούν δεδομένα που παράγονται από ΤΝ για αναδρομική εκπαίδευση

Followers 2
Φαίνεται ότι οι εταιρείες τεχνητής νοημοσύνης, όπως η Microsoft, η OpenAI και η Cohere, κάνουν ό,τι μπορούν για να βρουν συνθετικά δεδομένα με τα οποία θα εκπαιδεύσουν τα προϊόντα τεχνητής νοημοσύνης τους. Επικαλούμενες την περιορισμένη διαθεσιμότητα "οργανικών" δεδομένων που δημιουργούνται από τον άνθρωπο στον παγκόσμιο ιστό, οι εταιρείες αυτές στοχεύουν να χρησιμοποιήσουν δεδομένα που δημιουργούνται από την ΤΝ (συνθετικά) σε ένα είδος άπειρου βρόχου, όπου η εκπαίδευση επιτυγχάνεται σε δεδομένα που έχουν ήδη δημιουργηθεί παραγωγικά.

"Αν μπορούσατε να πάρετε όλα τα δεδομένα που χρειάζεστε από τον παγκόσμιο ιστό, αυτό θα ήταν φανταστικό", δήλωσε στους Financial Times ο Aidan Gomez, διευθύνων σύμβουλος της νεοφυούς εταιρείας LLM Cohere, η οποία έχει προϋπολογισμό 2 δισεκατομμύρια δολάρια. "Στην πραγματικότητα, ο ιστός είναι τόσο θορυβώδης και ακατάστατος που δεν είναι πραγματικά αντιπροσωπευτικός των δεδομένων που θέλετε. Ο ιστός απλώς δεν κάνει όλα όσα χρειαζόμαστε".

Και υπάρχει και το θέμα του κόστους, καθώς τα δεδομένα που παράγονται από τον άνθρωπο, σύμφωνα με τον Gomez, είναι "εξαιρετικά ακριβά". Αυτό έχει ήδη οδηγήσει στην ίδρυση ορισμένων εταιρειών "συνθετικών δεδομένων", όπως η Gretel.ai, η οποία ειδικεύεται στην παραγωγή συνθετικών συνόλων δεδομένων που στη συνέχεια πωλούνται για εκπαιδευτικούς σκοπούς.

Το πρόβλημα της διαθεσιμότητας και της προέλευσης των δεδομένων είναι ένας από τους μεγαλύτερους περιοριστικούς παράγοντες στη σημερινή εποχή της τεχνητής νοημοσύνης. Σήμερα, υπάρχουν πραγματικοί κίνδυνοι στην εκπαίδευση δικτύων ΤΝ με συνθετικά δεδομένα που έχουν ήδη "μασήσει" και παραχθεί από τις ίδιες τις ΤΝ. Πρώτον, υπάρχει το ζήτημα της επιδείνωσης των ελλείψεων των βασικών δεδομένων εκπαίδευσης: εάν το αρχικό, μη συνθετικό σύνολο δεδομένων εκπαίδευσης υπέφερε ήδη από προκαταλήψεις, οι ίδιες προκαταλήψεις θα συμπεριληφθούν, θα χωνευτούν και θα ενισχυθούν στις επόμενες επαναλήψεις εκπαίδευσης, αυξάνοντας τη σχετικότητά του.

Αλλά ένα άλλο, ίσως πολύ πιο σημαντικό ζήτημα προκύπτει από ένα πρόσφατα ανακαλυφθέν όριο: η ποιότητα των αποτελεσμάτων υποβαθμίζεται σοβαρά μετά από πέντε γύρους εκπαίδευσης σε συνθετικά δεδομένα που δημιουργούνται από την ΤΝ. Το κατά πόσον αυτή η συνθήκη "MAD" αποτελεί ένα μαλακό ή σκληρό όριο προς την εκπαίδευση της ΤΝ φαίνεται να είναι ένα ερώτημα που βρίσκεται στο επίκεντρο της πρόθεσης της Microsoft και της OpenAI να εκπαιδεύσουν αναδρομικά τα δίκτυα ΤΝ τους. Ωστόσο, πρόκειται για έναν χώρο που πιθανότατα θα δει έναν καταιγισμό μελετών- η Microsoft Research, για παράδειγμα, έχει δημοσιεύσει εργασίες σχετικά με αναδρομικά παραγόμενες σύντομες ιστορίες (που σημαίνει ότι ένα μοντέλο εκπαιδεύτηκε σε ιστορίες που δημιουργήθηκαν από ένα άλλο μοντέλο) και ένα δίκτυο ΤΝ κωδικοποίησης που εκπαιδεύτηκε σε τεκμηρίωση που δημιούργησε η ΤΝ γύρω από τον προγραμματισμό Python. Η επαλήθευση των κινδύνων εκφυλισμού των δεδομένων σε αυτά και σε άλλα, μεγαλύτερου μεγέθους μοντέλα (όπως το Llama 2 με 70Β παραμέτρους, που κυκλοφόρησε πρόσφατα σε ανοιχτό κώδικα από τη Meta) θα είναι το κλειδί για το πόσο μακριά (και πόσο γρήγορα) θα εξελιχθεί η τεχνητή νοημοσύνη στο άμεσο μέλλον.

Με τις εταιρείες που ασχολούνται με την τεχνητή νοημοσύνη να ζητούν όλο και περισσότερα δεδομένα, είναι λογικό να προσπαθούν να δημιουργήσουν αναδρομικά σύνολα δεδομένων υψηλής ποιότητας. Αυτό μπορεί να γίνει με πολλαπλούς τρόπους, αλλά ίσως αυτός με τις μεγαλύτερες πιθανότητες επιτυχίας προέρχεται από το να αφήσουμε απλώς δύο δίκτυα ΤΝ να αλληλεπιδράσουν μεταξύ τους, με το ένα να παίρνει το ρόλο του δασκάλου και το άλλο το ρόλο του μαθητή. Η ανθρώπινη παρέμβαση θα ήταν (και θα είναι πάντα) απαραίτητη, ωστόσο, προκειμένου να διαλέγονται τα σημεία δεδομένων χαμηλότερης ποιότητας και να ελέγχονται οι "ψευδαισθήσεις" (επιβεβαιώσεις της ΤΝ που δεν είναι αληθινές).

Υπάρχουν κάποια εμπόδια στο δρόμο προς το τεχνοκρατικό όνειρο μιας αυτοαναπτυσσόμενης, αυτοδιδασκόμενης τεχνητής νοημοσύνης- μοντέλα που μπορούν να έχουν εσωτερικές συζητήσεις, εσωτερικές ανακαλύψεις και που παράγουν νέα γνώση που δεν είναι απλή ανάμειξη και αντιστοίχιση (αν και αυτό είναι ένα από τα χαρακτηριστικά της δημιουργικής παραγωγής, άλλωστε).

Φυσικά, πρέπει να έχουμε κατά νου ότι δεν είναι όλα τα όνειρα ευχάριστα. Έχουμε ήδη πρόβλημα να αντιμετωπίσουμε τους εφιάλτες που προκαλούνται από τον άνθρωπο- δεν μπορούμε να πούμε πόσο επιδραστικοί μπορεί να είναι οι "εφιάλτες" μιας μηχανής, ίσως μέχρις ότου μάθουμε, αν ονειρεύεται ηλεκτρικά πρόβατα.
llama 2

llm

εκπαίδευση

παραγωγή δεδομένων

τεχνητή νοημοσύνη
Πηγή
Φωτογραφία: Shutterstock
1
Κοινοποίηση
https://www.thelab.gr/news/%CF%84%CE%B5%CF%87%CE%BD%CE%B7%CF%84%CE%AE-%CE%BD%CE%BF%CE%B7%CE%BC%CE%BF%CF%83%CF%8D%CE%BD%CE%B7/%CE%B5%CF%84%CE%B1%CE%B9%CF%81%CE%B5%CE%AF%CE%B5%CF%82-%CF%84%CE%BD-%CE%B1%CE%BD%CE%B1%CE%B6%CE%B7%CF%84%CE%BF%CF%8D%CE%BD-%CE%B4%CE%B5%CE%B4%CE%BF%CE%BC%CE%AD%CE%BD%CE%B1-%CF%80%CE%BF%CF%85-%CF%80%CE%B1%CF%81%CE%AC%CE%B3%CE%BF%CE%BD%CF%84%CE%B1%CE%B9-%CE%B1%CF%80%CF%8C-%CF%84%CE%BD-%CE%B3%CE%B9%CE%B1-%CE%B1%CE%BD%CE%B1%CE%B4%CF%81%CE%BF%CE%BC%CE%B9%CE%BA%CE%AE-%CE%B5%CE%BA%CF%80%CE%B1%CE%AF%CE%B4%CE%B5%CF%85%CF%83%CE%B7/
Followers 2
Ακολουθήστε το TheLab στο Viber για να λαμβάνετε πρώτοι όλες τις τεχνολογικές μας ειδήσεις καθώς και τις τελευταίες μας κριτικές προϊόντων.

TheLab Weekly Digest

Άρθρα, reviews και ό,τι κινήθηκε στο forum. Κάθε Κυριακή.

Go to ειδήσεις

User Feedback
0 Comments
Recommended Comments

There are no comments to display.

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!
Register a new account

Sign in

Already have an account? Sign in here.
Sign In Now

Similar Content
- OpenAI GPT-5.5: Το νέο μοντέλο AI είναι διαθέσιμο σε ChatGPT Plus και άνω
  
  By Newsbot, Απρίλιος 26
  - ai
  - chatgpt
  - (και 3 επιπλέον)
    
    Tagged with:
    
    ai
    
    chatgpt
    
    gpt-5.5
    
    llm
    
    openai
  - 0 comments
  - 569 views
- Train-to-Test Scaling: Πώς να βελτιστοποιήσεις ολόκληρο το AI compute budget από training ως inference
  
  By Newsbot, Απρίλιος 19
  - ai
  - inference
  - (και 3 επιπλέον)
    
    Tagged with:
    
    ai
    
    inference
    
    llm
    
    scaling laws
    
    test-time compute
  - 0 comments
  - 383 views
- Η Samsung και η AMD διευρύνουν τη στρατηγική τους συνεργασία για τις λύσεις μνήμης AI επόμενης γενιάς
  
  By astrolabos, Απρίλιος 7
  - amd
  - dram
  - (και 2 επιπλέον)
    
    Tagged with:
    
    amd
    
    dram
    
    samsung
    
    τεχνητή νοημοσύνη
  - 0 comments
  - 488 views
- Μνημόνιο συνεργασίας ΥΠΑΙΘΑ – Microsoft για την εισαγωγή AI βοηθού στο Ψηφιακό Φροντιστήριο
  
  By astrolabos, Απρίλιος 7
  - microsoft
  - τεχνητή νοημοσύνη
  - (και 2 επιπλέον)
    
    Tagged with:
    
    microsoft
    
    τεχνητή νοημοσύνη
    
    υπαιθα
    
    ψηφιακό φροντιστήριο
  - 0 comments
  - 407 views
- Η ΤΝ φτάνει και στους game servers, η εξαγορά της Hathora κόβει το multiplayer του Stormgate
  
  By astrolabos, Απρίλιος 4
  - game server
  - gaming
  - (και 3 επιπλέον)
    
    Tagged with:
    
    game server
    
    gaming
    
    hathora
    
    stormgate
    
    τεχνητή νοημοσύνη
  - 0 comments
  - 554 views

Sign In

Εταιρείες ΤΝ αναζητούν δεδομένα που παράγονται από ΤΝ για αναδρομική εκπαίδευση

User Feedback

Recommended Comments

Create an account or sign in to comment

Create an account

Sign in

Similar Content

OpenAI GPT-5.5: Το νέο μοντέλο AI είναι διαθέσιμο σε ChatGPT Plus και άνω

Train-to-Test Scaling: Πώς να βελτιστοποιήσεις ολόκληρο το AI compute budget από training ως inference

Η Samsung και η AMD διευρύνουν τη στρατηγική τους συνεργασία για τις λύσεις μνήμης AI επόμενης γενιάς

Μνημόνιο συνεργασίας ΥΠΑΙΘΑ – Microsoft για την εισαγωγή AI βοηθού στο Ψηφιακό Φροντιστήριο

Η ΤΝ φτάνει και στους game servers, η εξαγορά της Hathora κόβει το multiplayer του Stormgate

Αρχική

Blogs

Νέο Περιεχόμενο

Important Information

Sign In

Εταιρείες ΤΝ αναζητούν δεδομένα που παράγονται από ΤΝ για αναδρομική εκπαίδευση

TheLab Weekly Digest

User Feedback

Recommended Comments

Create an account or sign in to comment

Create an account

Sign in

Similar Content

Important Information