LU Eksakto zinātņu un tehnoloģiju fakultātes Datorikas nodaļas Bakalaura studiju programmas kurss.
Kursā izmantotie termini; sk. arī Termini.gov.lv.
- Teksta izgūšana: TextExtraction.ipynb
- Teksta priekšapstrāde: TextPreprocessing.ipynb
- Dinamiski ielādēta daudzvalodu satura apstrāde: DW_scrape.ipynb
- Morfoloģiskā analīze un sintēze: HFST.ipynb
- Teksta izvēršana un savēršana: Thrax.ipynb, Pynini.ipynb
- Latviešu valodas morfoloģiskais analizators un sintezators: TezaursAPI.ipynb
- Rīkkopas universālo atkarību parsēšanai: ParsingUD.ipynb
- N-grammu modeļi: NGram.ipynb
- Word2vec apmācība un lietojums: Word2vec.ipynb
- Teksta klasificēšana: LangID.ipynb, NaiveBayes.ipynb
- Teksta klasificēšana: fastText.ipynb (1-layer, linear) → BERT.ipynb (deep, non-linear)
- Modeļi un demonstrācijas Hugging Face platformā:
- Skatīt Tasks, piemēram:
Feature Extraction
: AiLab-IMCS-UL/lvbertFill-Mask
: google-bert/bert-base-casedSentence Similarity
: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
- Vārdšķiru un morfoloģiskā marķēšana (Part of Speech (POS) Tagging): POS_tagging.ipynb
- Nosaukto entitāšu marķēšana (Named entity recognition): NER.ipynb
LU HZF maģistra studiju programmas kurss:
prof. Inguna Skadiņa
asoc. prof. Normunds Grūzītis
asistents Viesturs Jūlijs Lasmanis
Kursa izstrādi finansē Eiropas Savienības Atveseļošanas un noturības mehānisma investīcija un valsts budžets projekta “Valodu tehnoloģiju iniciatīva” (2.3.1.1.i.0/1/22/I/CFLA/002) ietvaros.