Tajniki badania internetu

Umacnia się rola internetu nie tylko jako samego medium, ale również jako środowiska, w którym realizowane są badania rynkowe. Według danych ESOMAR-u w 2000 roku jedynie 5% wszystkich badań na świecie było realizowanych za pośrednictwem sieci. Przewiduje się, że już w 2005 roku odsetek ten wyniesie 15%, zaś po 2007 roku liczba badań realizowanych kanałem internetowym może przekroczyć liczbę badań realizowanych za pośrednictwem ankieterów. Jak bada się zachowania i oczekiwania internautów?

Do analizy popularności witryn i zachowań użytkowników w internecie najczęściej stosuje się takie miary jak: unikalny użytkownik, wizyta, odsłona, czy średni czas spędzony w serwisie. Internauta generuje tzw. odsłony (page views), na które składa się każde wyświetlenie strony. Użytkownik zwykle korzysta z kilku stron w krótkich odstępach czasu. Zbiór takich odsłon jest definiowany jako wizyta, przy czym każda następna wizyta liczona jest dopiero po 30 minutach od ostatniej reakcji użytkownika. Sumując czas pomiędzy kolejnymi odsłonami w ramach wizyty, otrzymujemy jej czas, zaś dodając do siebie czas trwania poszczególnych wizyt – czas spędzony przez użytkownika na stronach danego serwisu.

Za miarę popularności witryny uważa się liczbę tzw. unikalnych użytkowników (unique users lub unique visitors). Użytkownik identyfikowany jest za pomocą IP komputera, z którego nastąpiło połączenie lub/i przez nadane mu cookie. Cookie to niewielki plik tekstowy przechowywany w pamięci przeglądarki. Za każdym razem, gdy użytkownik zażąda obejrzenia strony, serwer sprawdzi, czy przeglądarka użytkownika wysłała nagłówek w cookie. Jeśli nie, program serwera wygeneruje unikatowy identyfikator i prześle żądaną stronę z nagłówkiem – „ustanów cookie”.

Od początku prowadzonych prac nad metodologią badań mierzenia oglądalności stron internetowych zaczęto stosować generalnie dwa typy pomiarów: site-centric (czyli pomiary od strony serwisu) i user centric (pomiary od strony użytkownika). Każdy ma swoje wady i zalety.

Z perspektywy witryny

Badania typu site-centric są prowadzone od strony serwisu (serwera). Zazwyczaj zbierają dane dotyczące tylko wybranego serwisu, albo też – gdy badania realizuje niezależna firma – dotyczą tylko tych serwisów, które zgodziły się na pomiar (w Polsce takie badania realizuje firma Gemius). Generalnie badania te przypominają audyt sprzedaży prasy – nie oferują danych o profilu społeczno-demograficznym użytkowników, za to zbierają dokładne dane dotyczące ruchu na stronie.

Badania typu site-centric to tak naprawdę bezpośrednia analiza logów dziennika serwera. Program jest domyślnie tak skonfigurowany, aby rejestrował każdy dostęp, wpisując za każdym razem linię w pliku systemowym. Dziennik serwera rejestruje sekunda po sekundzie każdą reakcję komputera, z którego wysłano żądanie do danej strony.

Dane uzyskiwane metodą site-centric dotyczą prawie całego audytorium danej witryny (czyli dotyczą zarówno użytkowników korzystających w domu, z pracy jak i w innych miejscach).

Warto jednak podkreślić, że dane uzyskiwane tą metodą obejmują jedynie liczby stron, które zostały „wysłane” użytkownikowi przez serwer danej witryny, a nie liczby stron, które zostały rzeczywiście przez niego obejrzane. Umyka też informacja o stronach tymczasowo przechowywanych na serwerach typu proxy[1] lub w cache’u przeglądarki[2] użytkownika (mamy do czynienia ze zbiorem logów zebranych jedynie przez serwer danej witryny).

Ograniczenia te znikają w momencie, gdy odwołanie do danej strony mierzy niezależny serwer, a nie serwer, na którym znajduje się badana strona. Dzieje się tak dzięki specjalnym skryptom, które „wklejone” w strukturę poszczególnych stron umożliwiają pomiar przez serwer firmy badawczej. Tak oznaczone strony są przez niego rozpoznawane, niezależnie od tego, gdzie znajduje się ich lokalizacja (serwer badanej strony, serwer typu proxy, czy pamięć podręczna przeglądarki).

Potencjalnym źródłem błędów są też tzw. boty, czyli programy indeksujące, stosowane przez popularne wyszukiwarki. Niejednokrotnie są przyczyną niezwykle silnych wzrostów oglądalności poszczególnych stron, które były przez nich indeksowane.

W przypadku badań site-centric niejednokrotnie występuje trudność dokładnej identyfikacji miejsca skąd pochodzą użytkownicy. Chociaż w logach zawarta jest informacja o lokalizacji komputera użytkownika to nie zawsze można w sposób jednoznaczny zidentyfikować geograficzne pochodzenie wizyt.

Unikalny użytkownik użytkownikowi nie równy

 Powszechnie przyjęto określać wielkość internetowego audytorium, podając liczbę tzw. unikalnych użytkowników, czyli takich, którzy odwiedzili daną stronę, co najmniej jeden raz w określonym czasie (zwykle w okresie jednego miesiąca). Jednak z tym terminem wiążą się pewne niejasności.

Po pierwsze, sama liczba unikalnych użytkowników – jak już zostało wspomniane – określana jest na podstawie albo numeru komputera IP, albo też najczęściej na bazie cookie. Dokładnej identyfikacji podlega w ten sposób tak naprawdę komputer użytkownika, a ściślej jego przeglądarka. Z jednego komputera może korzystać więcej niż jeden użytkownik, sam użytkownik może korzystać z wielu komputerów, w różnych miejscach (na przykład w pracy i w domu). W końcu internauta może zainstalować nową przeglądarkę lub po prostu usunąć cookie. Należy pamiętać zatem, że zmiany audytorium danej strony mogą też w jakiejś części wynikać z w/w względów, a nie tylko z rzeczywistego spadku lub wzrostu zainteresowania daną witryną.

Z perspektywy użytkownika

Badania user-centric, (czyli badania od strony użytkownika), realizowane są z myślą przede wszystkim o uzyskaniu informacji na temat wielkości internetowego audytorium oraz jego  cech społeczno-demograficznych oraz użytkowników poszczególnych witryn.

Można tu mówić generalnie o trzech sposobach / metodach realizacji:

1]   badania realizowane na reprezentatywnych próbach ogółu populacji, prowadzone drogą wywiadu ankieterskiego (face-to-face) lub wywiadu telefonicznego.

2]   badania realizowane w internecie przy wykorzystaniu ankiet (najczęściej typu pop-up) wypełnianych przez użytkowników określonych stron, na których realizowane jest badanie.

3]   badania panelowe realizowane na próbach użytkowników, którzy korzystają z internetu w domu i/ lub pracy i zgodzili się na zainstalowanie na własnych komputerach specjalnego oprogramowania mierzącego ich aktywność w sieci. Badanie panelowe oznacza, że badamy wciąż tą samą grupę ludzi. Oczywiście, skład próby jest, co jakiś czas zmieniany (rotowany), aby uwzględnić zmiany w strukturze społeczno-demograficznej internautów.

Badania user-centric, szczególnie te wykorzystujące, specjalne oprogramowanie, które instalowane jest na komputerach użytkowników dostarczają:

  • szczegółowych informacji o cechach społeczno-demograficznych użytkowników (zwykle zbiera się informacje o płci, wieku, poziomu wykształcenia, zawodu, uzyskiwanych dochodach itp.)
  • informacji o zasięgu i częstotliwości kontaktów wyświetlanej zawartości witryn i serwisów za pomocą przeglądarki użytkownika (jak wielu spośród badanych użytkowników odwiedzało konkretną stronę i jak często to robiło).
  • zbiera też informacje o odsłonach generowanych na serwerach typu proxy i w cache’u przeglądarki użytkownika

Badania user-centric posiadają też pewne ograniczenia. Na pewno istotną wadą jest to, że realizowane są na próbie, która zwykle reprezentatywna jest jedynie dla części audytorium internetu  (swoim zasięgiem obejmuję użytkowników korzystających z internetu z domu i/lub z pracy). Nie zapewniają szczegółowych danych na temat aktywności użytkowników poniżej poziomu domen w sieci. Badanie charakteryzuje się ograniczoną „rozdzielczością” – z uwagi na dużą fragmentaryzację sieci wiele istotnych witryn w ogóle nie może zostać objętych pomiarem adekwatnym do kosztów. Badania te zwykle są bardzo kosztowne (duża próba, wysokie koszta rekrutacji i utrzymania panelistów).

O tym, jak bada internet brytyjski NOP World Consumer, można przeczytać w artykule:

http://www.internetstandard.com.pl/news/66366.html

Jak to wygląda w Polsce?

W naszym kraju od paru lat prowadzone są badania sondażowe internetu. Badanie Net Track, realizowane przez firmę SMG/KRC, badanie Interbus, realizowane przez TNS OBOP i prowadzone przez ARC Rynek i Opinię przy pomocy metody wywiadu telefonicznego, badanie Internet Monitor. Pomiary te udostępniają dane o wielkości populacji polskich internautów, jej strukturze społeczno-demograficznej, ale też o wielkości i profilu społeczno-demograficznym użytkowników poszczególnych witryn. Przy czym, badania te obejmują jedynie te witryny, o które pyta się badanych w czasie wywiadu. Należy też pamiętać, że chociaż wszystkie trzy badania realizowane są przy pomocy podobnych technik (ich filozofia badawcza jest podobna, czyli ludzie badają ludzi), to różnice występujące na poziomie schematu doboru próby, sposobu zadawanych pytań w kwestionariuszu prowadzą do różnic na poziomie wyników.

Poza tym należy mieć na uwadze, że wszystkie te badania „mierzą” tak naprawdę deklarację o pewnych zachowaniach, zbierają określone nastawienia respondentów do ich zachowań w sieci. Dotykają tak delikatnej i zawodnej materii, jaką jest pamięć respondentów. Dlatego też dane uzyskiwane w tych sondażach należy traktować bardziej w kategoriach wiedzy i świadomości, postaw niż w kategoriach informacji o zachowaniach.

O szczegółach badania polskiego internetu opowiada w wywiadzie z Internet Standard Marcin Pery, wiceprezes Gemius S.A.: http://www.internetstandard.com.pl/news/64747.html

 

Badania PBI

Badania internetu prowadzone poprzez internet realizuje w Polsce firma Gemius. Pierwsze z nich to tzw. Megapanel – projekt badawczy realizowany dla Polskich Badań Internetu – spółki, którą tworzą cztery największe polskie portale Gaztea.pl. Interia.pl., Onet.pl. i Wirtualna Polska oraz wydawnictwo Presspublica.

Badanie to jest klasycznym przykładem odmiany pomiaru user-centric, jakim jest panel internautów. Jego specyfika polega na tym, że rekrutacja użytkowników nie odbywa się poprzez dobór reprezentatywnej próby przy pomocy wywiadu face-to-face, czy wywiadu telefoniczengo (tzw. screening). Badani rekrutowani są na stronach głównych portali, przy pomocy ankiety wyświetlanej w okienku typu pop-up. W kwestionariuszu proszeni są o podanie swoich cech społeczno-demograficznych oraz o zainstalowanie specjalnego programu, którego celem jest pomiar ich zachowań w sieci. Wyniki są następnie ważone (chodzi o dopasowanie struktury analizowanej próby pod względem podstawowych cech społeczno-demograficznych) do znanej struktury internautów, w oparciu o inny – omawiany już wcześniej – projekt badawczy, jakim jest badanie Net Track. Sposób rekrutacji (poprzez internet) umożliwia też analizowanie zachowań użytkowników, którzy korzystają z internetu w różnych miejscach (w domu, w pracy, w kafejce internetowej itp.).

Jest to jedno z większych badań tego typu na świecie (największy projekt to realizowany w stanach Zjednoczonych, ComScore, którego próba wynosi 1,5 mln. użytkowników). Badana próba obejmuje ponad 40 tysięcy panelistów i ciągle rośnie. Tak duży rozmiar próby pozwala na prowadzenie analiz nawet na poziomie poszczególnych serwisów wchodzących w skład dużych portali.

Warto dodać, że do tej pory wyniki PBI nie ujrzały światła dziennego (więcej na ten temat w artykule: http://www.internetstandard.com.pl/news/63563.html ). Internet Standard nieoficjalnie dowiedział się jednak, że jest duża szansa na opublikowanie rezultatów panelu na początku lipca br.

 

Badanie gemiusAudience

W wyniku porozumienia zawartego między najważniejszymi sieciami reklamowymi, a firmą Gemius pojawił się też inny typ badań. Został celowo dostosowany do pomiaru zarówno wielkości ruchu, liczby, jak też cech społeczno-demograficznych użytkowników odwiedzających małe, niszowe serwisy wchodzące w skład poszczególnych sieci reklamowych. Metoda pomiaru zastosowana przy tym projekcie oparta jest na dwóch oddzielnych, ale zintegrowanych ze sobą systemach:

Pop-up surveys (gemiusProfile) – deklaracje respondentów składane na losowo wyświetlanych ankietach w formacie pop-upów. Co n-temu użytkownikowi wyświetla się specjalna ankieta z pytaniami dotyczącymi podstawowych cech społeczno-demograficznych, o wypełnienie której jest proszony.

Site-centric system (gemiusTraffic)  – pomiar metodą site-centric zainstalowany na wszystkich witrynach podlegających pomiarowi (w strukturze strony wklejany jest niewielki skrypt, który rejestruje odsłonę na serwerze badawczym, dzięki temu system mierzy również strony otwarte zarówno na serwerach typu proxy, jak i w cach’u przeglądarki użytkownika).

Badanie to obejmuje swoim zasięgiem użytkowników blisko 350 witryn.

Jako kombinacja metod site-centric i user-centric projekt ten oferuje nie tylko dane o cechach społeczno-demograficznych użytkowników poszczególnych witryn, ale też dane geolokalizacyjne i dane o współoglądalności poszczególnych stron.

Pomiary ukazały silną zależność pomiędzy cechami użytkowników, a ich skłonnością do wypełniania ankiety. Dzięki czemu, został stworzony specjalny algorytm, który umożliwia identyfikacje użytkowników (tzw. real users w przeciwieństwie do unique users).

Użytkownik, który wypełni ankietę na witrynie A, wchodząc na witrynę B, nadbudowuje profil tej drugiej. W ten sposób każdy internauta, który odpowie na pytania kwestionariusza, uczestniczy w budowaniu profili społeczno-demograficznych odwiedzanych przez siebie witryn. Właściwość taka została osiągnięta dzięki możliwości identyfikowania internautów (za pomocą mechanizmu cookie) na serwisach, na których ruch mierzy system gemiusTraffic. Więcej informacji: http://www.gemius.pl

Podstawowa charakterystyka najczęściej spotykanych metod badawczych użytkowników internetu

 

Metoda badań

podstawowy rodzaj uzyskiwanych danych

ograniczenia

możliwości

metoda site-centric badania natężenia ruchu na stronieliczba unikalnych użytkownikówliczba odsłonliczba wizytśredni czas spędzony na stronie brak danych demograficznychtrudność w identyfikacji rzeczywistej liczby użytkowników (dobrze znana tylko liczba cookie)trudność w dokładnej identyfikacji geograficznego pochodzenia wizytgdy brak skryptów pozwalających na pomiar przez niezależny serwer – brak informacji o liczbie odsłon stron będących na serwerach proxy i w cache’u przeglądarkiobejmują tylko te witryny, które mierzono pomiar pełnego audytorium badanej strony
metoda user-centric – badania panelowe badania natężenia ruchu na stronieliczba unikalnych użytkownikówliczba odsłonliczba wizytśredni czas spędzony na stronie

dane społeczno-demograficzne poszczególnych witryn

zwykle reprezentacja ograniczona  do użytkowników korzystających z domu i/lub pracymała rozdzielczość – dokładne dane dotyczą tylko dużych portali i licznie odwiedzanych serwisów dane zbierane przez oprogramowanie, które mierzy wszystkie zachowania użytkowników w siecipotencjalnie obejmują wszystkie witryny, które przeglądał użytkownik
metoda user-centric – badania sondażowe dane oparte na deklaracjachprofil społeczno-demograficzny poszczególnych witryn tak, naprawdę mierzą znajomość marki poszczególnych serwisówobejmują tylko te witryny, o które pytano w miarę dokładna wiedza o zmianach w liczbie i strukturze społeczno-demograficznej internautów danego kraju, niejednokrotnie są podstawą dla ważenia danych uzyskiwanych z badań panelowych
metoda user-centric – badania ankietowe realizowane online dane oparte na deklaracjachprofil społeczno-demograficzny poszczególnych witryn dane dotyczą tylko tych stron, które biorą udział w badaniumożliwe błędy spowodowane brakiem odpowiedzi od wszystkich respondentów, którzy zostali poproszeni o wypełnienie ankiety dokładne dane o demografii użytkowników badanych witryn, szczególnie przydatne do pomiarów małych, niszowych serwisów

 

Standard niezbędny

Prawda jest taka, że badanie jest badaniu nie równe. Dlatego też tak ważne jest, aby wypracować jednolity standard, który obejmuje nie tylko rzetelną i trafną metodologię, ale też uznawany przez wszystkich uczestników rynku słownik zasadniczych pojęć stosowanych do interpretacji wyników. Wielką rolę odgrywa tu dokładne zdefiniowanie audytorium, technik pomiaru wraz z podaniem ich ograniczeń i potencjalnych możliwości.

Większość badań internetu w Polsce i na świecie realizowanych jest z myślą o reklamodawcach i właścicielach mediów online. Takie kodeksy, jak ESOMAR, czy FAST zawierają wiele sugestii i wskazówek, jakie badania będzie można uznać za jak najbardziej dokładną projekcję zachowań internetowego audytorium. Stosowane metody badawcze muszą zawierać jasne i czytelne reguły, według których wyceniać będzie się powierzchnię reklamową.

Artykuł opublikowany w serwisie Internet Standard 17.05.2004


[1] Serwer przekaźnikowy, umożliwiający dostawcy dostępu bądź innemu pośrednikowi lokalne gromadzenie najczęściej wywoływanych stron w sieci.

[2] Tymczasowa przestrzeń na dysku, przydzielona przeglądarce internetowej, co pozwala jej pełnić w komputerze użytkownika taką samą rolę jak serwer proxy, chyba że przeglądarka zostanie inaczej skonfigurowana

2 thoughts on “Tajniki badania internetu

  1. Anderson pisze:

    It’s an amazing paragraph designed for all the web people; they will take benefit from it I am sure.

  2. bypass icloud pisze:

    Oh my goodness! Awesome article dude! Thank you, However I am encountering problems with your RSS.
    I don’t know why I can’t subscribe to it. Is there anyone else getting identical RSS problems?
    Anybody who knows the answer will you kindly respond? Thanx!!

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Log Out / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Log Out / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Log Out / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Log Out / Zmień )

Connecting to %s

%d blogerów lubi to: