Πως να αποφύγετε μια σημαντική παγίδα στην ανάλυση δεδομένων.

Δεν υπάρχει μεγαλύτερη παγίδα από τη γρήγορη κατάληξη σε συμπεράσματα.

Οι περισσότεροι από εμάς όταν βλέπουμε επιτυχημένες ιστοσελίδες με υψηλή θέση εμφάνισης στα αποτελέσματα αναζήτησης, σπάνια ελέγχουμε αν αυτό οφείλεται στη δομή της σελίδας, στις λέξεις-κλειδιά, στην ποιότητα των backlinks ή σε άλλους λόγους. Συνήθως δεχόμαστε το αποτέλεσμα χωρίς περαιτέρω ανάλυση και αυτή η γρήγορη κατάληξη σε συμπεράσματα μπορεί να οδηγήσει σε σημαντικά λάθη στρατηγικής σημασίας.

Προτού προχωρήσετε σε ένα συμπέρασμα, είστε υποχρεωμένοι να εξετάσετε διάφορες πιθανότητες:

• Πλήρης σύμπτωση
• Αντίστροφη αιτιώδης συνάφεια
• Κοινή αιτιώδης συνάφεια
• Γραμμικότητα
• Ευρεία εφαρμογή

Αν αυτά σας μπέρδεψαν και δεν βγάζετε νόημα, μην ανησυχείτε. Είναι αρκετά φυσιολογικό γιατί είναι μια μορφή “αργκό”. Ας δούμε το παράδειγμα: “Ο μύθος του τυριού”:

Προτού σας προειδοποιήσω να μην φάτε τυρί επειδή μπορεί να πάθετε κάτι σοβαρό στο κρεβάτι σας, είμαι υποχρεωμένος να ελέγξω ότι δεν συμβαίνουν τα εξής:

Πλήρης σύμπτωση – Είναι πιθανό να έγινε σύγκριση με τόσες πολλές ομάδες δεδομένων, που κάποιες να έτυχε να ήταν παρόμοιες; Ναι, είναι πολύ πιθανό.

Αντίστροφη αιτιώδης συνάφεια – Είναι πιθανό να το βλέπουμε από λάθος μεριά; Για παράδειγμα, κάποιοι που θέλουν να αυτοκτονήσουν και έχουν πιστέψει το μύθο του τυριού, τρώνε τυρί σε μεγάλες ποσότητες για να πεθάνουν; Αυτό φαίνεται αρκετά απίθανο, οπότε ας το προσπεράσουμε. Ναι, είναι πολύ απίθανο.

Κοινή αιτιώδης συνάφεια – Υπάρχει πιθανότητα ότι κάποιοι τρίτοι παράγοντες είναι πίσω και από τα δύο; Ίσως η αντίληψη ότι το καλό φαγητό σας κάνει πιο υγιείς (ώστε να μην πεθάνετε από την πείνα) και άρα αυτό υποσυνείδητα θα σας “αναγκάσει” να φάτε περισσότερο τυρί; Ναι, είναι πολύ πιθανό.

Γραμμικότητα – Συγκρίνουμε δύο γραμμικές τάσεις; Μια γραμμική τάση είναι ένας σταθερός ρυθμός ανάπτυξης ή μείωσης. Οποιεσδήποτε δύο στατιστικές, οι οποίες είναι και οι δύο γραμμικές κατά τη διάρκεια του χρόνου, θα συσχετιστούν πολύ καλά. Αν ένα γράφημα έχει σχεδιαστεί με διαφορετικές κλίμακες, μπορεί οι στατιστικές να φαίνονται τελείως άσχετες, αλλά επειδή και οι δύο έχουν ένα σταθερό ρυθμό, θα ήταν ακόμα πολύ καλά συσχετιζόμενες. Ναι, αυτό φαίνεται πιθανό.

Ευρεία εφαρμογή – Υπάρχει πιθανότητα αυτή η σχέση να υπάρχει μόνο σε ορισμένα σενάρια εξειδικευμένων θεμάτων ή, τουλάχιστον, όχι στο σενάριό μου; Ίσως, για παράδειγμα, το τυρί προκαλεί αυτό το αποτέλεσμα σε μερικούς ανθρώπους, και αυτό αρκεί για να δημιουργηθεί αυτή η συσχέτιση, καθώς υπάρχουν τόσο λίγα θύματα που πεθαίνουν στο κρεβάτι τους με κάποιον άλλο τρόπο; Ναι, αυτό φαίνεται πιθανό.

Πως να αποφύγετε μια σημαντική παγίδα στην ανάλυση δεδομένων

Από τις 5 περιπτώσεις του “μύθου του τυριού”, έχουμε 4 απαντήσεις “Ναι” και μία απάντηση “Όχι”.

Εάν το παράδειγμά σας δεν λάβει 5 “όχι” από αυτούς τους 5 ελέγχους, θεωρείται μια αποτυχία και δεν μπορείτε να πείτε ότι η μελέτη έχει καθορίσει είτε έναν παράγοντα κατάταξης είτε μια θανατηφόρα παρενέργεια της κατανάλωσης τυριού.

Μια παρόμοια διαδικασία θα πρέπει να ισχύει για μελέτες περιπτώσεων, οι οποίες είναι μια άλλη μορφή συσχέτισης – η συσχέτιση ανάμεσα σε εσάς που κάνετε μια αλλαγή και κάτι καλό (ή κακό) που συμβαίνει από αυτήν.

Ας δούμε ένα παράδειγμα πιο κοντά στο αντικείμενο μας από ότι το τυρί. Για παράδειγμα, αναρωτηθείτε:

  • Έχω αποκλείσει άλλους παράγοντες SEO (π.χ. εξωτερική ζήτηση, εποχικότητα, ανταγωνιστές που κάνουν λάθη);
  • Έχω αυξήσει την επισκεψιμότητα στην ιστοσελίδα κάνοντας αυτό που προσπάθησα να κάνω ή κατά λάθος βελτίωσα κάποιο άλλο παράγοντα ταυτόχρονα;
  • Μήπως αυτό λειτούργησε κατά λάθος στο συγκεκριμένο πελάτη/έργο;

Αυτό είναι ιδιαίτερα δύσκολο για τους ειδικούς SEO, επειδή σπάνια έχουμε δεδομένα αυτής της ποιότητας, αλλά θα πρότεινα ένα πρόσθετο ζεύγος ερωτήσεων που θα σας βοηθήσει να πλοηγηθείτε σε αυτό το “ναρκοπέδιο”:

  • Εάν ήμουν η Google, θα το έκανα αυτό;
  • Εάν ήμουν η Google, θα μπορούσα να το κάνω αυτό;

Η άμεση επισκεψιμότητα ως παράγοντας κατάταξης περνάει τη δοκιμασία “θα μπορούσε”, αλλά μόνο ελάχιστα. Ωστόσο, δεν περνάει πραγματικά τη δοκιμασία “θα το έκανε” – θα ήταν πολύ ευκολότερο για τη Google να χρησιμοποιήσει την επώνυμη oργανική επισκεψιμότητα αναζήτησης, η οποία θα απαντούσε στις ίδιες ερωτήσεις που θα μπορούσατε να απαντήσετε συγκρίνοντας τα επίπεδα άμεσης επισκεψιμότητας (π.χ. πόσο δημοφιλής είναι αυτός ο ιστότοπος;).

*ΑΠΑΓΟΡΕΥΕΤΑΙ ΡΗΤΑ η αντιγραφή και οποιαδήποτε χρήση, αναπαραγωγή, αναδημοσίευση, αποθήκευση, πώληση, μετάδοση, διανομή, έκδοση. Εκτέλεση, φόρτωση (download), μετάφραση, τροποποίηση με οποιονδήποτε τρόπο, τμηματικά ή περιληπτικά του περιεχομένου της ιστοσελίδας. Ακόμα και με αναφορά της πηγής με ενεργό σύνδεσμο, χωρίς έγγραφη άδεια του εκδότη.