Un nou conjunt d’eines de models lingüístics de codi obert
El sector dels grans models lingüístics continua creixent. StabilityAI, fabricant de la popular eina de generació d’imatges Stable Diffusion, ha llençat un paquet d’eines de models lingüístics de codi obert.
Coneix StableLM
Batejades com a “StableLM”, les versions alfa del paquet d’accés públic contenen actualment models amb 3,000 i 7,000 milions de paràmetres, amb models de 15,000, 30,000 i 65,000 milions de paràmetres “en desenvolupament” i un model de 175,00 .
La mida importa?
En comparació, GPT-4 té un recompte de paràmetres estimat en un bilió, sis vegades superior al del seu predecessor GPT-3.
Tot i això, el recompte de paràmetres pot no ser una mesura uniforme de l’eficàcia de LLM, com va assenyalar StabilityAI a l’entrada de bloc en què anunciava el llançament de StableLM:
“StableLM està entrenada en un nou conjunt de dades experimental construït sobre The Pile, però tres vegades més gran amb 1.5 bilions de tokens de contingut […] La riquesa d’aquest conjunt de dades proporciona a StableLM un rendiment sorprenentment alt en tasques conversacionals i de programació, malgrat la seva petita grandària de 3 a 7 bilions de paràmetres”.
Com de robustos són els models de StableLM?
De moment no és clar fins a quin punt són robustos els models de StableLM. L’equip de StabilityAI va assenyalar a la pàgina de Github de l’organització que aviat s’oferiria més informació sobre les capacitats de LM, incloses les especificacions del model i els ajustaments d’entrenament.
Interessat a provar StableLM?
Sempre que els models funcionin prou bé a les proves, l’arribada d’una potent alternativa de codi obert a ChatGPT d’OpenAI podria resultar interessant per al món del comerç de criptomonedes.
Com ja t’expliquem anteriorment, la gent està construint bots de comerç avançats usant l’API GPT i noves variants que incorporen l’accés a eines de tercers, com ara BabyAGI i AutoGPT.
La incorporació de models de codi obert a la barreja podria ser una benedicció per a traders experts en tecnologia que no vulguin pagar les primes d‟accés d‟OpenAI.
Prova StableLM a HuggingFace
Els interessats poden provar una interfície en temps real per al model StableLM de 7B paràmetres allotjada a HuggingFace.
En resum, el llançament de StableLM per part de StabilityAI és un emocionant desenvolupament al món dels grans models lingüístics de codi obert. Tot i que encara no és clar com són de robustos aquests models, la possibilitat de tenir accés a eines d’aquesta magnitud i sofisticació pot ser una benedicció per als traders experts en tecnologia que busquen evitar els alts costos d’accés a les eines de tercers. A més, l’enfocament de StableLM en el rendiment en tasques conversacionals i de programació pot tenir aplicacions valuoses en àrees com ara el comerç de criptomonedes. En definitiva, caldrà seguir de prop el desenvolupament de StableLM i veure com afecta el panorama dels grans models lingüístics.