WordStat for Stata

Nowość w ofercie

WordStat for Stata umożliwia integrację pakietu WordStat 7 z programem Stata, popularnym oprogramowaniem do analizy danych statystycznych. Nowe właściwości współpracy pakietów łączą innowacyjną analizę numeryczną programu Stata z unikalnymi funkcjami do analizy tekstu znajdującymi się w programie WordStat 7, w tym modelowanie tematów, analizę połączeń tekstów, ekstrakcję nazw jednostek i inne.

WordStat for Stata został opracowany, aby umożliwić użytkownikom programu Stata 13 oraz Stata 14 techniki analizy tekstu na dowolnym ciągu zmiennych zapisanych w pliku danych Stata. Pakiet łączy analizę treści z technikami statystycznymi celem szybkiego wyodrębniania tematów, wzorów i relacji w dużych zbiorach danych. Pakiet jest w stanie przetworzyć miliony słów w przeciągu kilku sekund i porównać wyodrębnione tematy z innymi zmiennymi numerycznymi lub kategorycznymi w pliku Stata.

Użytkownicy programu WordStat 7 mogą pobrać i aktywować WordStat for Stata nieodpłatnie. Należy pobrać ostatni upgrade WordStat 7 (v 7.0.8) ze strony aktualizacji producenta i uruchomić “Integration into Stata” w menu Start | Provalis Research | WordStat menu.

Text mining
Zintegrowane narzędzia do analizy wyszukanego tekstu i wizualizacji (grupowanie, wielowymiarowe skalowanie, mapa kliknięć, analiza zgodności), aby szybko wyodrębnić tematy i automatycznie zidentyfikować wzorce.



Modelowanie tematów
Szybki przegląd najistotniejszych zagadnień z dużych zbiorów tekstowych. Panel boczny narzędzia pozwala również porównać częstotliwość występowania konkretnych tematów dla różnych zmiennych wykorzystując wykresy słupkowe i wykresy liniowe.



Kategoryzowane słowniki
Możliwe jest użycie istniejących lub stworzenie własnych słowników, składających się ze słów, wzorców, zwrotów bliskoznacznych. Błędy ortograficzne i słowa nieznane są automatycznie dopasowywane do wpisów istniejących w słowniku użytkownika i mogą być też szybko dodawane, jako nowe elementy. Przeprojektowany interfejs rozpoznaje także potencjalne zamienniki słów, jak również wykrywa ewentualne błędy w pisowni wyrazów, które występują w słowniku.


Analiza porównawcza
Badanie relacji pomiędzy danymi nieustrukturyzowanymi i ustrukturyzowanymi z użyciem narzędzi statystycznych i graficznych (analizy korespondencji, map kliknięć, wykresów bąbelkowych, itp).



Analiza połączeń
Nowa funkcja Link Analysis pozwala na wyświetlanie na jednym ekranie wielowymiarowego grafu obrazującego połączenia występujące w tekście. Wykres jest interaktywny i pozwala na eksplorowanie danych w celu zbadania połączeń sekcji tekstu.



Uczenie maszynowe
Opracowanie automatycznych modeli klasyfikacyjnych dokumentu za pomocą naiwnego klasyfikatora Bayesa i metody K-najbliższych sąsiadów. Modele klasyfikacyjne mogą być następnie zapisane na dysku i ponownie zastosowane dla nowych danych.



Wykresy
Ilustrują wzory i umożliwiają odkrycie złożonych zjawisk za pomocą interaktywnych narzędzi do wizualizacji, takich jak wykresy słupkowe, wykresy liniowe, mapy kliknięć, chmur tekstu, wykresów bąbelkowych, itp. Wykresy można skopiować i wklejać lub też zapisać na dysku w formacie plików jpg, bmp i png.



Wizard konwersji dokumentów
Kreator konwersji dokumentów pozwala łatwo zaimportować dane do nowego rodzaju pliku programu Stata tj. .DTA. Dokumenty można importować z plików w różnych formatach (doc, html, pdf, txt) i następnie automatycznie wyodrębniać numeryczne i alfanumeryczne wartości z dokumentów strukturalnych.

Script logo