Nell’ambito di uno sforzo continuo per migliorare l’usabilità delle ricerche di database vettoriali IA all’interno dei sistemi di generazione aumentata dal recupero (RAG) tramite l’ottimizzazione dell’uso delle unità a stato solido (SSD), KIOXIA ha annunciato un aggiornamento del suo software KIOXIA AiSAQ (All-in-Storage ANNS with Product Quantization). Questa nuova versione open-source introduce controlli flessibili che consentono agli architetti di sistema di definire il punto di equilibrio tra le prestazioni di ricerca e il numero di vettori, fattori in contrasto tra loro nella capacità fissa di archiviazione SSD nel sistema. Il vantaggio che ne deriva consente agli architetti di sistema RAG di trovare il giusto equilibrio tra carichi di lavoro specifici e loro requisiti, senza alcuna modifica hardware.
Introdotto per la prima volta nel gennaio 2025, il software KIOXIA AiSAQ utilizza un innovativo algoritmo di ricerca approssimativa del vicino più prossimo (ANNS) ottimizzato per gli SSD ed elimina la necessità di memorizzare i dati di indice in DRAM. Abilitando le ricerche vettoriali direttamente sugli SSD e riducendo i requisiti di memoria host, la tecnologia KIOXIA AiSAQ consente ai database vettoriali di scalare, in gran parte senza le restrizioni dovute alla limitata capacità DRAM.
Le novità di KIOXIA AiSAQ
Quando la capacità installata dell’SSD nel sistema è fissa, l’aumento delle prestazioni di ricerca (query al secondo) richiede una maggiore capacità SSD consumata per vettore. Il risultato è un numero inferiore di vettori. Al contrario, per massimizzare il numero di vettori, è necessario ridurre il consumo di capacità SSD per vettore, il che si traduce in prestazioni inferiori. L’equilibrio ottimale tra queste due condizioni opposte varia a seconda del carico di lavoro specifico. Per trovare l’equilibrio appropriato, il software KIOXIA AiSAQ introduce opzioni di configurazione flessibili. Quest’ultimo aggiornamento consente agli amministratori di selezionare l’equilibrio ottimale per una varietà di carichi di lavoro contrastanti all’interno del sistema RAG. Questo aggiornamento rende la tecnologia KIOXIA AiSAQ un ANNS basato su SSD adatto non solo alle applicazioni RAG, ma anche ad altre applicazioni che richiedono un uso intensivo di vettori, come le ricerche semantiche offline.
Con la crescente domanda di servizi di intelligenza artificiale scalabili, gli SSD offrono un’alternativa pratica alla DRAM per gestire l’elevato throughput e la bassa latenza richiesti dai sistemi RAG. Il software KIOXIA AiSAQ permette di soddisfare queste esigenze in modo efficiente, offrendo la possibilità di utilizzare l’intelligenza artificiale generativa su larga scala senza essere vincolati da risorse di memoria limitate.
Grazie al rilascio di KIOXIA AiSAQ come software open-source, KIOXIA rafforza il suo impegno nei confronti della comunità IA promuovendo architetture basate su SSD per un’IA scalabile.
Dichiarazioni
“Il nostro obiettivo è supportare costantemente gli sviluppatori e gli architetti di sistema nell’ottimizzare prestazioni e capacità in modi nuovi e innovativi“, ha dichiarato Axel Störmann, Vice President e Chief Technology Officer per i prodotti Memory e SSD, KIOXIA Europe. “Ora, con l’introduzione dell’ultima versione del software KIOXIA AiSAQ, gli utenti finali possono sfruttare la potenza degli SSD per costruire sistemi RAG scalabili in modo flessibile ed efficiente. Rendendo open-source la nostra tecnologia, rinnoviamo il nostro impegno nei confronti della comunità dell’intelligenza artificiale offrendo soluzioni potenti e accessibili“.