Google Books Ngram Viewer, στατιστικά για τη γλώσσα και την κουλτούρα μέσα από εκατομμύρια βιβλία του Google Books
Ο Google Books Ngram Viewer είναι ένα site της Google όπου μπορούμε να δούμε σε ένα γράφημα τη συχνότητα εμφάνισης λέξεων ή φράσεων στα βιβλία της περιόδου 1500 με 2008 που έχουν σκαναριστεί από το Google.
Η υπηρεσία είναι προς το παρόν διαθέσιμη στα αγγλικά (αμερικάνικα και βρετανικά αγγλικά ή συνδυασμένα, αλλά και άλλες υποκατηγορίες), τα γαλλικά, τα κινέζικα, τα γερμανικά, τα ρωσικά και τα ισπανικά. Μπορούμε να δούμε τα αποτελέσματα για μία λέξη ή φράση ή να συγκρίνουμε τα αποτελέσματα για περισσότερες λέξεις ή φράσεις που μας ενδιαφέρουν και επίσης να επιλέξουμε τη χρονική περίοδο της αναζήτησης, τη γλώσσα, την ακρίβεια στην απεικόνιση της γραφικής παράραστασης, ενώ με ένα κλικ γίνεται η αναζήτηση στο Google Books για το σε ποια βιβλία βρίσκουμε τις λέξεις που συγκρίνουμε.
Πέρα από τους γλωσσικούς περιορισμούς, τα γραφήματα δε βασίζονται στο σύνολο των 15 εκατομμυρίων βιβλίων που έχουν σκαναριστεί από το Google Books, αλλά στα 5.2 εκατομμύρια, που και πάλι είναι ένα εκτενέστατο corpus κειμένων. Καταγράφονται οι λέξεις ή οι φράσεις που έχουν τουλάχιστον 40 εμφανίσεις, ενώ δε λείπουν και λάθη που οφείλονται στο σκανάριασμα.
Το Google Books Ngram Viewer είναι ένα πολύ ισχυρό εργαλείο για την καταγραφή των τάσεων στη γλώσσα, στον πολιτισμό, στην ιστορία, στην πολιτική, στις φυσικές επιστήμες. Και είναι χρήσιμο τόσο για πρόχειρη χρήση όσο και για ερευνητικούς σκοπούς. Μια τέτοια ερευνητική προσπάθεια έγινε με τη δημοσίευση στο περιοδικό Science του άρθρο Quantitative Analysis of Culture Using Millions of Digitized Books, μια δουλειά ερευνητών στο πανεπιστήμιο Harvard σε συνεργασία με τη Google.
Διαβάστε επίσης:
- Πόσα βιβλία υπάρχουν στον κόσμο; 129.864.880 απαντάει το Google Books
- Ξεκίνησε η λειτουργία του Google ebookstore (πρώην Google Editions)
- Google Books Preview για τον Chrome, το extension για άμεση πρόσβαση στο Google Books
Πηγές: About Google Books Ngram Viewer, Inside Google Books, Google Books Ngram Viewer Datasets