The seminar's issues relate to data analysis methods and their use primarily to assess the risk of economic and social life, as well as to identify risk factors, e.g. unemployment risk, insolvency, termination of business, occurrence of an insurance event.
As part of the seminar topics can be implemented, among others from the following areas:
Problematyka seminarium dotyczy metod analizy danych i ich wykorzystania przede wszystkim do oceny ryzyka występującego w życiu ekonomiczno-społecznym, a także do identyfikacji czynników ryzyka, np. ryzyka bezrobocia, niewypłacalności, zakończenia działalności gospodarczej, wystąpienia zdarzenia ubezpieczeniowego.
W ramach seminarium mogą być realizowane tematy m. in. z następujących obszarów:
The scope of the seminar:
The seminar's issues include broadly defined statistical data analysis as well as sample surveys and simulation methods. When preparing the thesis, students can use both primary data sources, which will constitute their own empirical research, and secondary sources - including GUS, NBP and other bulletins.
I suggest the following sample issues of master's theses:
1) The use of statistical methods (including data mining methods) in the analysis of the structure, dynamics of selected socio-economic phenomena, e.g. in the analysis of the labour market, insurance markets.
2) Simulation methods - the role, applications and development of research using Monte Carlo methods, random number generators, randomness testing. Simulation studies, e.g. comparing the quality of exploratory data analysis methods, examining the properties of estimators in large data sets.
3) Statistical methods and possibilities of computer data processing - e.g. proposition of own module for analysing research results.
4) Application of the sample survey in the analysis of a selected economic and social phenomenon.
5) Problems of sample research - e.g. problems of insufficient sample size (statistics of small areas), construction of the sampling frame; questionnaire construction issues; role of random and non-random errors in the study.
Problematyka seminarium obejmuje zarówno zagadnienia szeroko pojętej statystycznej analizy danych, jak i badań próbkowych oraz metod symulacyjnych. Przygotowując pracę magisterską studenci korzystać mogą zarówno z pierwotnych źródeł danych, które stanowić będą własne badania empiryczne, jak i ze źródeł wtórnych – m.in. biuletynów GUS, NBP i inne.
Potencjalnym seminarzystom proponuję następującą, przykładową problematykę prac magisterskich:
1) Zastosowanie metod statystycznych (w tym metod eksploracji danych) w analizie struktury, dynamiki wybranych zjawisk społeczno-ekonomicznych, np. w analizie rynku pracy, rynków ubezpieczeniowych.
2) Metody symulacyjne – rola, zastosowania i rozwój badań metodami Monte Carlo, generatory liczb losowych, testowanie losowości. Symulacyjne badania np. porównujące jakość metod eksploracyjnej analizy danych, badające własności estymatorów w dużych zbiorach danych.
3) Metody statystyczne a istniejące możliwości komputerowego przetwarzania danych – np. propozycja własnego modułu do analizy wyników badań.
4) Zastosowanie badania próbkowego w analizie wybranego zjawiska ekonomiczno-społecznego.
5) Problemy badań próbkowych – np. problemy niedostatecznej liczebności próby (statystyka małych obszarów), budowa operatu losowania; problemy konstrukcji kwestionariusza; rola błędów losowych i nielosowych w badaniu.
Seminarium poświęcone jest wydobywaniu wiedzy z danych (data science). Studenci mogą pisać pracę na dowolny, wybrany przez siebie temat z dziedziny nauk ekonomicznych, w którym problem badawczy jest rozwiązywany za pomocą odpowiednich metod analizy danych lub dotyczy różnych aspektów pracy z danymi. Szczególnie chętnie widziane są prace z zagadnień:
Seminarium poświęcone jest wydobywaniu wiedzy z danych (data science). Studenci mogą pisać pracę na dowolny, wybrany przez siebie temat z dziedziny nauk ekonomicznych, w którym problem badawczy jest rozwiązywany za pomocą odpowiednich metod analizy danych lub dotyczy różnych aspektów pracy z danymi. Szczególnie chętnie widziane są prace z zagadnień:
- algorytmy uczenia maszynowego i metody data mining (dla celów klasyfikacji, regresji, grupowania, redukcji wymiarowości),
- źródła i jakość danych,
- przygotowywanie danych do analizy (m.in. postępowanie w przypadku braków danych, wykrywanie i postępowanie z obserwacjami odstającymi),
- wizualizacja danych (szczególnie w środowisku R),
- symulacje komputerowe,
- fundamenty wnioskowania na podstawie danych (w tym klasyczna estymacja i weryfikacja hipotez, wnioskowanie bayesowskie, wnioskowanie na podstawie prób nieprostych).
Najman
The scope of the seminar:
The scope of the Master's seminar covers all theoretical issues and empirical applications of contemporary data analysis methods in solving economic or social problems. When preparing the thesis, students should demonstrate the ability to analyse data from various administrative and non-administrative sources.
Master's thesis can also be based on the design and implementation of your own sample survey, in particular sample survey. Using in particular the methods of data mining, artificial intelligence, and multi-dimensional statistical analysis, the following problems can be analysed:
The student can also combine their own interests, indicate the usefulness of the data processing techniques used in the proposed issue, including the usefulness of Big Data collections.
Zakres seminarium magisterskiego obejmuje wszelkie zagadnienia teoretyczne i zastosowania empiryczne współczesnych metod analizy danych w rozwiązywaniu problemów ekonomicznych lub społecznych. Przygotowując pracę magisterską student powinien wykazać się umiejętnością analizy danych pochodzących z różnych źródeł administracyjnych i poza administracyjnych.
Praca magisterska może być także oparta na projekcie i realizacji własnego badania próbkowego, w szczególności badania reprezentacyjnego. Posługując się w szczególności metodami data mining, sztucznej inteligencji, statystycznej analizy wielowymiarowej analizowane mogą być problemy:
grupowania i klasyfikacji danych w tworzeniu profili konsumentów, segmentacji rynku, pojemności i chłonność rynku, zasięgu i pozycjonowania na rynku, analizy konkurencji, powiązań między współkupowanymi produktami
- analiza koszykowa, badania postaw i zwyczajów konsumentów oraz nastrojów i postaw społecznych, identyfikacji emocji w wypowiedziach internetowych.
Student może również połączyć własne zainteresowania, wskazać użyteczność zastosowanych technik przetwarzania danych w proponowanym zagadnieniu, w tym użyteczność zbiorów Big Data.
Zakres seminarium obejmuje wszelkie zagadnienia teoretyczne i zastosowania empiryczne współczesnych metod analizy danych w rozwiązywaniu problemów ekonomicznych lub społecznych. Przygotowując pracę magisterską student powinien wykazać się umiejętnością analizy danych pochodzących z różnych źródeł administracyjnych i poza administracyjnych, w tym ze zbiorów niestrukturyzowanych takich jak portale społecznościowe. Posługując się w szczególności metodami data mining, sztucznej inteligencji, statystycznej analizy wielowymiarowej, teorii grafów, web i tekst mining analizowane mogą być w szczególności problemy:
- grupowania i klasyfikacji danych w tworzeniu profili konsumentów, segmentacji rynku, analizy ryzyka inwestycyjnego,
- potrzeb i zwyczajów konsumentów oraz nastrojów i postaw społecznych,
- identyfikacji emocji w wypowiedziach internetowych (hejt, lajkowanie, identyfikacja fałszywych ocen, botów),
- identyfikacji spamu w korespondencji elektronicznej,
- budowy i testowania efektywności algorytmów w inwestycjach na rynku finansowym,
- budowy scoringów kredytowych.
Zakres seminarium obejmuje wszelkie zagadnienia teoretyczne i zastosowania empiryczne współczesnych metod analizy danych w rozwiązywaniu problemów ekonomicznych lub społecznych. Przygotowując pracę magisterską student powinien wykazać się umiejętnością analizy danych pochodzących z różnych źródeł administracyjnych i poza administracyjnych, w tym ze zbiorów niestrukturyzowanych takich jak portale społecznościowe. Posługując się w szczególności metodami data mining, sztucznej inteligencji, statystycznej analizy wielowymiarowej, teorii grafów, web i tekst mining analizowane mogą być w szczególności problemy:
- grupowania i klasyfikacji danych w tworzeniu profili konsumentów, segmentacji rynku, analizy ryzyka inwestycyjnego,
- potrzeb i zwyczajów konsumentów oraz nastrojów i postaw społecznych,
- identyfikacji emocji w wypowiedziach internetowych (hejt, lajkowanie, identyfikacja fałszywych ocen, botów),
- identyfikacji spamu w korespondencji elektronicznej,
- budowy i testowania efektywności algorytmów w inwestycjach na rynku finansowym,
- budowy scoringów kredytowych.
Opis tematyki
Problematyka seminarium obejmuje przede wszystkim empiryczne zastosowania nowoczesnych technik analizy danych statystycznych do opisu interesujących studentkę/studenta zagadnień ekonomicznych lub społecznych. W pracy magisterskiej studenci powinni pokazać, jaką nową wiedzę o wybranych zjawiskach można uzyskać dzięki zastosowaniu poznanych w okresie studiów metod i technik analizy danych. Może to być także wskazanie użytecznych w życiu codziennym zastosowań technik przetwarzania danych, w tym wielkich zbiorów informacji – Big Data.
Praca magisterska może być także oparta na projekcie i realizacji własnego badania próbkowego, w szczególności badania reprezentacyjnego.
Osoby zainteresowane w większym stopniu zagadnieniami numerycznymi i informatycznymi mogą zawrzeć w swoje pracy magisterskiej próbę rozwiązania określonego zagadnienia poprzez wykorzystanie metod symulacyjnych.
The seminar's issues concern the use of statistical methods in the analysis of economic phenomena. The aim of the seminar will be to acquire the skills to prepare scientific work, expand knowledge of selected statistical methods learned during studies and apply them to the analysed economic problem. Students can suggest the research topic themselves or use the promoter's hints. Depending on the research problem selected, students can use empirical analysis data collected independently (own research) or secondary data, e.g. Social Diagnosis database, European Social Survey, open Worldbank data, data from loan institutions and many others. Master's theses can be devoted to graphic and analytical analysis of the structure of selected socio-economic phenomena, study of relationships between variables and dynamics of phenomena. In the case of a causal relationship study, the proposed statistical methods include: logit models, event history analysis methods, competing risk analysis models. Students can also join the research conducted by the promoter, which include, among others:
- modelling the risk of the borrower defaulting (default risk),
- application of event history analysis methods to economic issues, e.g. testing the determinants of the length of time a customer remains a customer,
- applying competitive event models to economic issues, e.g. examination of the time to the end of the loan due to repayment or insolvency, examination of the duration of marriages due to the reason for termination of marriage,
- risk determinants of causing a traffic accident due to the characteristics of the perpetrator,
- consequences of generations for the insurance market,
- fuzzy regression applications.
Problematyka seminarium dotyczy wykorzystania metod statystycznych w analizie zjawisk ekonomicznych. Celem seminarium będzie nabycie umiejętności przygotowywania pracy naukowej, poszerzenie wiedzy z zakresu wybranych metod statystycznych poznanych w czasie studiów i zastosowania ich do analizowanego problemu ekonomicznego. Studenci mogą samodzielnie zaproponować temat badań lub skorzystać z podpowiedzi promotora. W zależności od wybranego problemu badawczego studenci mogą wykorzystywać w analizach empirycznych dane samodzielnie zgromadzone (badania własne) lub dane wtórne, np. bazę Diagnozy Społecznej, European Social Survey, open Worldbank data, dane instytucji pożyczkowych i wiele innych. Prace magisterskie mogą być poświęcone graficznej i analitycznej analizie struktury wybranych zjawisk społeczno-ekonomicznych, badaniu relacji między zmiennymi oraz dynamice zjawisk. W przypadku badania zależności o charakterze przyczynowym, wśród proponowanych metod statystycznych znajdują się: modele logitowe, metody analizy historii zdarzeń, modele zdarzeń konkurujących (competing risks analysis). Seminarzyści mogą się również włączyć do badań prowadzonych przez promotora, które dotyczą m.in.:
- modelowania ryzyka niewywiązania się kredytobiorcy z zobowiązań (ryzyko niewypłacalności),
- zastosowania metod analizy historii zdarzeń do zagadnień ekonomicznych, np. badanie determinant długości pozostawania klientem danej firmy,
- zastosowania modeli zdarzeń konkurujących do zagadnień ekonomicznych, np. badanie czasu do zakończenia kredytu z powodu jego spłaty lub niewypłacalności, badanie czasu trwania małżeństw ze względu na przyczynę zakończenia małżeństwa,
- determinanty ryzyka spowodowania wypadku komunikacyjnego ze względu na cechy sprawcy,
- implikacje następstwa pokoleń dla rynku ubezpieczeniowego,
- zastosowania regresji rozmytej.