arbeiten:llms-for-generating-training-data

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
arbeiten:llms-for-generating-training-data [30.11.2023 12:00] – [Data-Entry] Nils Constantin Hellwigarbeiten:llms-for-generating-training-data [16.04.2024 18:12] (aktuell) – [Data-Entry] Nils Constantin Hellwig
Zeile 8: Zeile 8:
 ErstgutachterIn_thesisprofessor        : Christian Wolff ErstgutachterIn_thesisprofessor        : Christian Wolff
 ZweitgutachterIn_secondthesisprofessor : David Elsweiler ZweitgutachterIn_secondthesisprofessor : David Elsweiler
-Status_thesisstate                     : in Bearbeitung+Status_thesisstate                     : abgeschlossen
 Stichworte_thesiskeywords              : Sentiment Analysis, Natural Language Processing, Large Language Models, Sentiment Analyse, Sprachverarbeitung, Sprachmodelle Stichworte_thesiskeywords              : Sentiment Analysis, Natural Language Processing, Large Language Models, Sentiment Analyse, Sprachverarbeitung, Sprachmodelle
 angelegt_dt                            : 2023-07-14 angelegt_dt                            : 2023-07-14
 Anmeldung_dt                           :  Anmeldung_dt                           : 
 Antrittsvortrag_dt                     : 2023-10-23 Antrittsvortrag_dt                     : 2023-10-23
-Abschlussvortrag_dt                    :  +Abschlussvortrag_dt                    : 2024-04-15 
-Abgabe_dt                              : +Abgabe_dt                              : 2024-04-10
 Textlizenz_textlicense                 :  # #Lizenz|## Textlizenz_textlicense                 :  # #Lizenz|##
 Codelizenz_codelicense                 :  # #Lizenz|## Codelizenz_codelicense                 :  # #Lizenz|##
 ---- ----
 +
 +
  
  
Zeile 36: Zeile 38:
 === Tasks === === Tasks ===
  
-- Data acquisition: Reviews posted on TripAdvisor in the German language+- Data acquisition: German language reviews posted on TripAdvisor 
 - Data annotation: ABSA Annotation of 5,000 sentences from the reviews (aspect term, aspect category, sentiment polarity) - Data annotation: ABSA Annotation of 5,000 sentences from the reviews (aspect term, aspect category, sentiment polarity)
 - LLM augmentation: GPT-3.5 (175B parameters) and Llama2-70B (70B parameters) - LLM augmentation: GPT-3.5 (175B parameters) and Llama2-70B (70B parameters)