Prancūzijos AI startuolis „Mistral“, remiamas „Microsoft“ ir, kaip pranešama, vertinamas 6 mlrd.
„Codestral“, skirta padėti kūrėjams rašyti ir sąveikauti su kodu, kaip ir daugelis kitų kodą generuojančių modelių, buvo apmokytas daugiau nei 80 programavimo kalbų, įskaitant Python, Java, C++ ir JavaScript, duomenų rinkiniu, paaiškina Mistral. tinklaraščio straipsnis. Codestral gali atlikti kodavimo funkcijas, rašyti testus ir „užpildyti“ dalinį kodą, taip pat atsakyti į klausimus apie kodų bazę anglų kalba.
„Mistral“ modelį apibūdina kaip „atvirą“, tačiau dėl to galima diskutuoti. Startuolio licencija draudžia naudoti Codestral ir jo išėjimus bet koks komercinė veikla. Yra „plėtros“ išskyrimas, tačiau net ir tai labai suvaržyta – licencija aiškiai draudžia „bet kokį vidinį naudojimą darbuotojams įmonės verslo veiklos kontekste“.
Priežastis gali būti ta, kad Codestral buvo iš dalies apmokytas autorių teisių saugomo turinio. „Mistral“ tinklaraščio įraše nepatvirtino ir nepaneigė, tačiau tai nenuostabu tiksliai – yra įrodymų, kad ankstesniuose startuolio mokymo duomenų rinkiniuose buvo autorių teisių saugomi duomenys.
Bet kokiu atveju Codestral gali būti nevertas vargo. Modeliui, kurio svoris yra 22 GB, reikalingas galingas kompiuteris, kad jis veiktų. Ir tai vos lenkia „Meta's Llama 3“ modelį pagal populiarius kodavimo etalonus.
Nors daugeliui kūrėjų tai nepraktiška, o našumo gerinimo požiūriu Codestral neabejotinai pakurstys diskusijas dėl išmintingumo pasikliauti kodą generuojančiais modeliais kaip programavimo asistentais.
Kūrėjai naudoja generatyvius AI įrankius bent kai kurioms kodavimo užduotims atlikti. 2023 m. birželio mėn. „Stack Overflow“ apklausoje 44 % kūrėjų teigė, kad dabar naudoja AI įrankius savo kūrimo procese, o 26 % planuoja netrukus. Tačiau šios priemonės turi akivaizdžių trūkumų.
Per pastaruosius kelerius metus „GitClear“ išanalizavus daugiau nei 150 milijonų kodo eilučių, skirtų projektų atpirkimams, nustatyta, kad generatyvūs AI kūrimo įrankiai lemia, kad į kodų bazes patenka daugiau klaidingų kodų. Kitur saugumo tyrinėtojai perspėjo, kad tokie įrankiai gali sustiprinti esamas klaidas ir saugumo problemas programinės įrangos projektuose; Daugiau nei pusė atsakymų, kuriuos OpenAI ChatGPT pateikia į programavimo klausimus, yra neteisingi, rodo Purdue atliktas tyrimas.
Tai netrukdys tokioms įmonėms kaip „Mistral“ ir kitoms bandyti užsidirbti pinigų ir pasidalyti mintimis su savo modeliais. Šį rytą „Mistral“ paleido „Codestral“ priglobtą versiją savo „Le Chat“ pokalbio AI platformoje ir mokamą API. „Mistral“ teigia, kad taip pat pavyko sukurti „Codestral“ į programų sistemas ir kūrimo aplinkas, tokias kaip „LlamaIndex“, „LangChain“, „Continue.dev“ ir „Tabnine“.