niedziela, 26 kwietnia 2015

7 kroków do usprawnienia pracy w R

Problem

Codzienna praca analityka z pewnością wygląda różnie. Są miejsca, w których spędza się długi czas nad jednym projektem, gdzie dużą wagę przykłada się do każdego detalu jak również są miejsca, w których wykonuje się kilka zadań dziennie wspomagając bieżące funkcjonowanie biznesu. Obojętnie, w której z tych skrajnych sytuacji zawsze trzeba mieć wszystko dobrze poukładane. Warto wyrobić sobie rutynę organizowania systemu plików, dokumentacji, sposobu nazewnictwa plików, funkcji, zmiennych tak aby zawsze nie było problemu w poruszaniu się po naszym warsztacie analitycznym. Skrypty pisane przez nas powinny być dokumentem rejestrującym kolejno wszystkie czynności popełnione w trakcie realizacji projektu. To wymaga pewnych umiejętności i nauki wielu 'niepotrzebnych' technik aby zaprogramować każdy etap generowania raportu od plików wejściowych do plików z wynikami i wizualizacjami. Takie podejście nosi miano reproducible research (jaki jest polski odpowiednik? Odtwarzalne analizy?). Reproducible research jest niezwykle cenione w środowisku analitycznym, gdzie proces badawczy musi być rzetelny i wiarygodny dla osób, które na ich podstawie będą podejmować decyzje.