Bard AI di Google ora può scrivere ed eseguire codice per rispondere a una domanda Ars Technica

Bard AI di Google ora può scrivere ed eseguire codice per rispondere a una domanda Ars Technica

Può fornire Language Large Models (LLM) come ChatGPT e Google Bard Alcuni Risposte decenti a certi tipi di domande, ma ironia della sorte, questi computer sono piuttosto scarsi nel calcolo. Google ha una nuova soluzione per provare a far sì che i modelli linguistici svolgano compiti semplici, come la matematica, giusto: ottieni l’intelligenza artificiale Scrivi un programma. Google afferma che ora quando chiedi al Bardo un compito “computazionale” come la matematica o la manipolazione di stringhe, invece di mostrare l’output di un modello di linguaggio, quel modello di linguaggio scriverà invece un programma, eseguirà quel programma e quindi visualizzerà l’output di quello programma all’utente come risposta.

Un post sul blog di Google fornisce un esempio di una voce che “inverte la parola ‘Lollipop’ per me”. ChatGPT capovolge questa domanda e dà la risposta errata “pillopoL”, perché i modelli linguistici vedono il mondo in frammenti di parole, o “simboli”, e non sono molto bravi in ​​questo. Questo è un esempio dell’output di Bard:

Google

Ottieni l’output corretto come “popilloL”, ma anche quello è più interessante Include il codice Python Ho scritto per rispondere alla domanda. Questo è fantastico per le persone interessate alla programmazione per vedere cosa c’è dietro il cofano, ma wow, questa è probabilmente la via d’uscita più spaventosa per le persone normali. Né è particolarmente rilevante. Immagina se Gmail ti mostrasse un blocco di codice quando gli hai appena chiesto di recuperare l’email. È strano. Fai solo il lavoro che ti viene chiesto, figo.

Google paragona un modello di intelligenza artificiale che scrive un programma agli esseri umani che eseguono una lunga divisione in quanto è un diverso modo di pensare:

Questo approccio è ispirato da un dualismo ben studiato nell’intelligenza umana, trattato specificamente nel libro di Daniel Kahneman Pensare veloce e lentoPensiero separato “Sistema 1” e “Sistema 2”.

  • Il pensiero del sistema 1 è veloce, intuitivo e facile. Quando un musicista jazz improvvisa sul momento o quando qualcuno pensa a una parola e la guarda apparire sullo schermo, sta usando il sistema di pensiero 1.
  • Al contrario, il pensiero del sistema 2 è lento, deliberato e laborioso. Quando esegui la divisione lunga o impari a suonare uno strumento, stai usando System 2.

In questa analogia, si può vedere che il LLM opera solo sotto il Sistema 1, producendo un testo rapidamente ma senza pensarci troppo. Ciò porta ad alcune capacità sorprendenti, ma può fallire in alcuni modi sorprendenti. (Immagina di provare a risolvere un problema di matematica usando solo il Sistema 1: non puoi fermarti a fare i conti, devi solo produrre la prima risposta che ti viene in mente.) I calcoli tradizionali sono strettamente allineati con il Sistema 2 pensare: è un processo stereotipato e inflessibile, ma la giusta sequenza di passaggi può portare a risultati impressionanti, come soluzioni di divisione lunghe.

Google afferma che il metodo “codifica al volo” verrà utilizzato anche per domande come: “Quali sono i fattori primi di 15.683.615?” e “Calcola il tasso di crescita dei miei risparmi”. La società afferma: “Finora, abbiamo visto questo metodo migliorare l’accuratezza delle risposte di Bard ai problemi di matematica e parole basati sulla numerazione nei nostri set di dati di sfida interni di circa il 30%”. Come al solito, Google avverte Bard che “potresti non aver capito bene” per aver interpretato male la tua domanda o, come tutti noi, aver scritto codice che non funziona la prima volta.

READ  Scolpito a mano da un unico pezzo di legno, il supporto per iPad Pro è dotato di un portamatite magnetico Apple!

Bard sta rapidamente codificando le risposte in questo momento se vuoi provarlo su bard.google.com.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *