TERMIN VEREINBAREN KONTAKT

VAGO sponsert neuen Trainingsansatz Laser-QLoRa und bringt sein Wissen in die Forschung mit ein

Es ist ein roter Laserstrahl zu sehen

Die LaserRMT Gruppe, bestehend aus Fernando Fernandes Neto, David Golchinfar und Eric Hartford hat herausgefunden, dass einzelne Schichten eines Sprachmodells unterschiedliche Lärmniveaus besitzen. Das Lärmniveau gibt nicht nur Aufschluss darüber welche Schichten „entrauscht“ werden sollten, sondern auch, welche Schichten eher dazu neigen, neues Wissen aufzunehmen.

Daher werden mit Laser-QLoRa jene Schichten eines Modells eingefroren, die weniger dazu neigen, neues Wissen aufzunehmen (Das reduziert die Wahrscheinlichkeit dass diese Schichten ihr bereits gelerntes Wissen vergessen) und nur die Schichten aufgetaut, die eher dazu neigen, neues Wissen aufzunehmen.

Welches Problem wird damit konkret gelöst? Das Hinzufügen neuer Fähigkeiten zu bereits vorhandenen feinabgestimmten Modellen ist äußerst anspruchsvoll. Der häufigste Ansatz besteht darin, den Datensatz um die gewünschte Zielkompetenz zu erweitern und erneut vom Basismodell zu trainieren. Das Fine-Tuning von einem bereits abgestimmten Modell führt jedoch oft zum Vergessen von Fähigkeiten.

Mit Laser-QLoRa können Unternehmen jetzt ihre Modelle einfacher und schneller auf stabilere Weise erweitern.

Link zum Github Repository

ZURÜCK