Práce s výstupy Zpět do akademie

OpenRefine

Práce s výstupy  |  20.5.2016

K postupům, níže uvedeným, je třeba mít nejprve nainstalovanou jednu z verzí nástroje OpenRefine. Ty naleznete ke stažení na:
http://openrefine.org/

Instrukce k instalaci a případným změnách v nástroji naleznete na:

Tvorba projektu z importovaných dat

K importu projektu do OpenRefine stačí vložit nástroji na vstup XLSX soubor staženého výstupu z Marketing Mineru. V druhém kroku poté zvolit list sheetu, který chcete zpracovávat. OpenRefine by měl automaticky detekovat kódování souboru a na ukázce výstupu zobrazit náhled projektu.

Po pojmenování projektu a stistknutí tlačítko Create project se založí nový projekt v OpenRefine, se kterým můžete dále pracovat za pomocí návodů, níže uvedených.

Aplikace facetů a filtrace nad výstupy

Jednou z nejsilnějších stránek OpenRefine je právě práce s Facety a Filtry. Ty uživateli dovolují rychlou práci s identifikací potenciálních problémů a příležitostí. Facety se zároveň dají mezi sebou kombinovat. Základní nástroje pro filtraci a segmentaci obsahu jsou:

Text Filter

Jednoduché vyhledávání skrze shodu části textu s obsahem buněk. V text filteru může uživatel pracovat s regulárními výrazy nebo označit, že jeho zadání je case sensitive (záleží na velikost písmen).

Textový filtr

Text Facet

Text Facet sdružuje buňky na základě jejich shody. Podívá se tedy do celého sloupce projektu, který si uživatel rozklinul a sdruží veškeré buňky se stejným obsah tak, aby si uživatel mohl filtrovat obsah stejných buněk ve sloupci.

Textový Facet

Tento Facet je svou funkcionalitou velmi podobný sdružení dle obsahu buněk při filtraci v nástroji Excel.

Numeric Facet

Numeric Facet vezme v potaz buňky použitého sloupce, ve kterých jsou čísla, a vynese je na osu X, ve které si uživatel může pomocí posouvání rozsahu osy vymezit data, se kterými chce pracovat (nebo která chce vidět).

Numeric Facet

Při vynesení Numeric Facetu nad více sloupci, se jejich omezení kombinují.

Scatterplot Facet

Scatterplot Facet funguje velmi podobně, jako Numeric Facet s tím rozdílem, že vynáší data na dvě osy najednou. Uživatel tak dostává na ose X jednu metirku a na ose Y druhou. Označením segmentu Scatterplot Facetu myší, se uživatel dostává k vyfiltrované obsahu, spadajícímu do jeho výběru.

Scatterplot Facet

Scatterplot Facet se skvěle hodí například pro Bostonskou matici.

Word Facet

Word Facet se nachází v sekci Customized Facets a jednoduše vezme buňky označeného sloupce, které rozdělí na slova. Poté spočítá frekvenci jejich výskytu a vynese ji uživateli na výstupu.

Word Facet

Skrze word facet se dá jednoduše zjistit frekvence výskytu specifických frází nebo při kontrole obsahu či kopírovaní od konkurence, určit počet výskytu dotazů.

Text-length Facet

Facet, který projde buňky označeného sloupce a jejich délku vynese na filtrovatelnou osu X.

Text-lenght Facet

Uživateli se může hodit například při kontrole délky titulku nebo při analýze inzerátů konkurence.

Facet by blank

Jednoduchý facet, který pouze projde buňky a ty které jsou prázdné vynese jako true, ostatní jako false.

Facet by blank

Že ses ještě nerozhodl?

Nevadí, můžeš si nás zdarma a jednoduše otestovat.