Jump to content
  • astrolabos
    astrolabos

    Apple DiffuCode-7B-cpGRPO: Νέο open-source AI μοντέλο κώδικα που γράφει… εκτός σειράς

    Η Apple κυκλοφόρησε αθόρυβα το DiffuCode-7B-cpGRPO, ένα νέο open-source AI μοντέλο για παραγωγή κώδικα, το οποίο ξεχωρίζει επειδή δεν ακολουθεί τη συνηθισμένη αριστερά-δεξιά, γραμμή-γραμμή διαδικασία των παραδοσιακών LLMs. Αντίθετα, χρησιμοποιεί diffusion-based decoding, μια τεχνική που του επιτρέπει να επεξεργάζεται και να βελτιώνει πολλά τμήματα του κώδικα ταυτόχρονα και εκτός σειράς, προσφέροντας ταχύτερη και πιο συνεκτική παραγωγή αποτελεσμάτων.

     

    Το DiffuCode-7B-cpGRPO βασίζεται στο Qwen2.5-7B της Alibaba, το οποίο η Apple προσαρμόζει με diffusion decoder και ειδικό fine-tuning (coupled-GRPO), εκπαιδεύοντάς το σε πάνω από 20.000 προσεκτικά επιλεγμένα δείγματα κώδικα. Το αποτέλεσμα ήταν μια βελτίωση 4,4% σε δημοφιλή benchmarks παραγωγής κώδικα, ενώ το μοντέλο διατηρεί τη δυνατότητα να λειτουργεί είτε με αυστηρή είτε με πιο ευέλικτη σειρά token generation, ανάλογα με τη ρύθμιση της θερμοκρασίας (temperature).

     

    Η προσέγγιση diffusion, γνωστή κυρίως από τα μοντέλα εικόνας (όπως το Stable Diffusion), επιτρέπει στο μοντέλο να βελτιώνει το αποτέλεσμα σε πολλαπλά περάσματα, χωρίς να περιορίζεται στη γραμμική ακολουθία των κλασικών autoregressive LLMs. Αυτό είναι ιδιαίτερα χρήσιμο για τον προγραμματισμό, όπου η συνολική δομή του κώδικα είναι πιο σημαντική από την απλή αλληλουχία των tokens.

     

    Αν και το DiffuCode-7B-cpGRPO δεν φτάνει ακόμη το επίπεδο μοντέλων όπως το GPT-4 ή το Gemini Diffusion, ξεχωρίζει ανάμεσα στα open-source coding models για την ταχύτητα και τη δομική συνοχή του κώδικα που παράγει. Το αν και πώς θα ενσωματωθεί σε εργαλεία όπως το Xcode ή αν θα αξιοποιηθεί από την κοινότητα, μένει να φανεί τους επόμενους μήνες. H Apple με το DiffuCode-7B-cpGRPO δείχνει ότι πειραματίζεται σοβαρά με νέες αρχιτεκτονικές στην παραγωγή κώδικα, ανοίγοντας τον δρόμο για πιο ευέλικτα, γρήγορα και δομικά «έξυπνα» AI εργαλεία ανάπτυξης.


    Πηγή
    Φωτογραφία: 9to5mac
×
×
  • Δημιουργία...

Important Information

Ο ιστότοπος theLab.gr χρησιμοποιεί cookies για να διασφαλίσει την καλύτερη εμπειρία σας κατά την περιήγηση. Μπορείτε να προσαρμόσετε τις ρυθμίσεις των cookies σας , διαφορετικά θα υποθέσουμε ότι είστε εντάξει για να συνεχίσετε.