Naukowa i Akademicka Sieć Komputerowa − Państwowy Instytut Badawczy
ul. Kolska 12
01-045 Warszawa
tel. 22 380 82 00
nask@nask.pl
www.nask.pl
Staż badawczy z zakresu przetwarzania języka naturalnego (NLP) w NASK
organizator:Naukowa i Akademicka Sieć Komputerowa − Państwowy Instytut Badawczy
Staż badawczy z zakresu przetwarzania języka naturalnego (NLP) w NASK
Zakład Inżynierii Lingwistycznej i Analizy Tekstu zaprasza ambitnych studentów studiów magisterskich i inżynierskich na staż badawczy z zakresu przetwarzania języka naturalnego (NLP). Oferta obejmuje możliwość pracy w zespole naukowym nad nowoczesnymi technologiami językowymi z potencjałem publikacyjnym. W ramach stażu przewidziane są dwa projekty badawcze:
- Polskojęzyczny model multimodalny (Vision-Language Model – VLM) – rozwój modelu łączącego analizę obrazu i języka naturalnego w języku polskim
- Polskojęzyczny model NLP dla danych medycznych – adaptacja dużego modelu językowego do specjalistycznych danych z obszaru medycyny i biologii
Poszukiwane są 2 osoby zainteresowane sztuczną inteligencją, językiem naturalnym i uczeniem maszynowym, które chcą zdobyć doświadczenie w pracy badawczej i rozwoju nowoczesnych technologii językowych. Staż ma charakter naukowo-badawczy. Praca na pograniczu badań podstawowych i aplikacyjnych, a celem każdego z projektów jest publikacja wyników w formie artykułu naukowego.
Zadania:
- Wstępna analiza literatury i przegląd istniejących rozwiązań
- Przygotowanie i przetwarzanie zbiorów danych z uwzględnieniem języka polskiego
- Implementacja, adaptacja i dostrajanie modeli językowych na wybranych zadaniach
- Projektowanie i implementacja benchmarków ewaluacyjnych z naciskiem na bezpieczeństwo i kontrolowalność modeli
- Analiza wyników eksperymentów i opracowanie raportów z postępów, przygotowanie publikacji naukowej podsumowującej projekt
Wymagania:
- Status studenta lub absolwenta studiów magisterskich, preferowane kierunki: informatyka, matematyka lub pokrewne
- Wiedza z zakresu przetwarzania języka naturalnego (NLP), w szczególności znajomość modeli językowych opartych na architekturze Transformer
- Doświadczenie w pracy z Pythonem i bibliotekami do uczenia maszynowego (PyTorch, Hugging Face Transformers)
- Umiejętność pracy z dużymi zbiorami danych tekstowych
- Znajomość języka angielskiego na poziomie umożliwiającym czytanie literatury naukowej
Dodatkowym atutem będzie znajomość zagadnień związanych z transfer learning i adaptacją modeli do domeny specjalistycznej.
Oferta:
- 4-miesięczny staż w Zakładzie Inżynierii Lingwistycznej i Analizy Tekstu w Centrum Badań i Rozwoju NASK PIB: od 30.06. do 30.09.2025 r.
- Staż w pełnym wymiarze 40 godzin tygodniowo
- Wynagrodzenie 5000 PLN miesięcznie
- 2 pozycje
Informacje pochodzą ze strony nask.pl.
Sprawdźcie też inne oferty stażowe dostępne na naszym portalu!
Spodobało Ci się to ogłoszenie? Wesprzyj nas na Patronite, żebyśmy mogli dodawać ich jeszcze więcej!