Apple Intelligence e il dataset The Pile: la causa legale che coinvolge i big della tecnologia
La questione del training dell’intelligenza artificiale con dati di dubbia provenienza torna prepotentemente nelle aule dei tribunali. Stavolta è Chicken Soup for the Soul, LLC a portare avanti una causa legale piuttosto ambiziosa, accusando praticamente tutti i colossi tecnologici di pirateria. Il punto centrale? Un archivio di dati noto come The Pile, utilizzato per addestrare modelli di intelligenza artificiale. E tra gli accusati compare anche Apple, che però nega categoricamente di averlo mai usato per sviluppare Apple Intelligence.
Cosa c’è dentro The Pile e perché fa discutere
The Pile è un enorme repository di dati pensato per il training di modelli AI. Il problema è che al suo interno si trovano contenuti protetti da copyright, inclusi file di sottotitoli provenienti da YouTube e altro materiale proprietario. Roba che, almeno sulla carta, non dovrebbe finire a nutrire algoritmi senza il consenso dei legittimi titolari dei diritti.
La causa intentata da Chicken Soup for the Soul punta il dito contro un elenco di nomi che fa impressione: Apple, Meta, xAI, Google, Anthropic, OpenAI, Perplexity e NVIDIA. Tutti accusati di aver violato il diritto d’autore addestrando i propri strumenti di intelligenza artificiale attingendo a questo dataset controverso.
Apple nega tutto, ma il problema resta enorme
Ecco il punto che rende questa vicenda particolarmente interessante. Apple ha già dichiarato in passato di non aver mai utilizzato The Pile per addestrare Apple Intelligence. Se questa posizione venisse confermata, la sua inclusione nella causa potrebbe rivelarsi un errore di mira da parte dei querelanti. Non sarebbe la prima volta che una class action nel settore tech finisce per coinvolgere aziende che poi si rivelano estranee ai fatti contestati.
Detto questo, il nodo centrale della questione va ben oltre la singola posizione di Apple. Il termine intelligenza artificiale è stato ormai applicato a qualsiasi cosa, perdendo quasi del tutto il suo significato originale. E questo rende anche più complesso stabilire chi abbia fatto cosa, con quali dati e in quale fase dello sviluppo.
Per le altre aziende coinvolte, la faccenda è decisamente più spinosa. Se dovesse emergere che The Pile è stato effettivamente impiegato per il training dei loro modelli, le implicazioni legali sarebbero pesanti. Il dibattito sul rapporto tra proprietà intellettuale e sviluppo dell’AI è tutt’altro che risolto, e cause come questa contribuiscono a definire i confini di quello che si può e non si può fare quando si addestrano sistemi così potenti. Apple Intelligence, nel frattempo, resta al centro della scena, anche se stavolta potrebbe uscirne pulita.


