צינור ישיר למספיק מידע?

לאורה קלי כותבת על ה-"knowledge panel" שלעתים קרובות מופיע כאשר עורכים חיפוש בגוגל. אם לפני 20 שנים חיפוש בגוגל העלה דף עם קישורים לדפים שהזכירו את המילים שעליהן ערכנו את החיפוש שלנו, היום התוצאות שונות מאד. כבר ב-2012 גוגל השיקה את ה-knowledge panel שבאופן אלגוריתמי (יש מי שיטען שבאופן קסמי) מביא לנו מידע ממוקד על הדבר שאנחנו כנראה חיפשנו. מתברר שעבור רוב הגולשים אפשר להסתפק במידע הזה:
That box is what Google calls a “knowledge panel,” a collection of definitive-seeming information (dates, names, biographical details, net worths) that appears when you Google someone or something famous. Seven years after their introduction, in 2012, knowledge panels are essential internet infrastructure: 62 percent of mobile searches in June 2019 were no-click, according to the research firm Jumpshot, meaning that many people are in the habit of searching; looking at the knowledge panel, related featured snippets, or top links; and then exiting the search. A 2019 survey conducted by the search marketing agency Path Interactive found that people ages 13 to 21 were twice as likely as respondents over 50 to consider their search complete once they’d viewed a knowledge panel.
יש מקרים שבהם המידע הזה באמת מספיק. אולי אנחנו בסך הכל רוצים לדעת אם האדם שעליו חשבנו באמת כתב ספר מסויים. במקרה הזה, סביר להניח שנקבל את התשובה בלי הצורך להקליק לתוך דפים של תוצאות. אבל יש הבדל גדול בין להיות "דרך אל המקור" לבין להיות "המקור" עצמו, ועבור משתמשים רבים כבר קשה להבחין בין השניים:

Google, like other tech companies, is struggling to draw lines between existing as a platform and being a publisher with a viewpoint. But many searchers now trust Google as a source, not just as a pathway to sources.

The Google Feature Magnifying Disinformation

הכתבה של קלי דנה בבעייתיות במקרים הלא כל כך מעטים שבהם המידע ב-knowledge panel מוטעה. אבל נדמה לי שמה שבאמת בעייתי היא הנטייה להסתפק בחלקיקי מידע.

כנראה שמדובר בהטיה בלתי-נמנעת

אין זה סוד שחברי הקונגרס האמריקאי אינם מומחים גדולים בטכנולוגיה דיגיטלית. בגלל זה הם מתקשים להבין את ההסברים שהם מבקשים מאנשי הטכנולוגיה שמעידים מולם. אבל גם בגלל זה אותם אנשי טכנולוגיה לא צריכים להתאמץ לתת הסבר ממצה. אלקסיס מדריגל מדווח על הפגישה של מנכ"ל גוגל עם חברי הקונגרס, ומנסה להסביר למה פיצ'אי איננו רוצה למסור תשובה ברורה ומקיפה לשאלה של למה גוגל מקשרת ליותר כתבות מהעיתונות הליברלית מאשר לשמרנית:

Here’s what Pichai cannot say: The “mainstream media” are far better resourced, and their ideals of informational quality are much closer to the ones that Google’s machine rankings prefer. Mainstream media organizations have tens of thousands of skilled journalists. The organizations that Republicans compare The New York Times to are a fraction of the size, have far less training in the field, and often don’t even aspire to journalistic norms. The right-wing-media ecosystem has grown tremendously, but—with important exceptions—not through the kind of fact-based reporting that mainstream media have long valued.

Without the ability to simply lay that out, for obvious political reasons, Pichai could not realistically respond to the Republican attacks.

What Google CEO Sundar Pichai Couldn’t Explain to Congress

אם היה מספר את ה-"אמת", או לפחות להסביר את המצב האמיתי, אנשי הקונגרס הרפובליקנים היו טוענים שיש בהסבר שלו הוכחה להטיה, ואפילו להטיה מכוונת.

הקצנה זוחלת (ולפעמים דוהרת)

זיינפ טופקי (Zeynep Tufekci) כותבת על בדיקות שהיא, וגם אחרים, ערכו ב-YouTube. אחרי חיפוש אחר סרטונים בעלי גישה די מתונה היא מצאה שמנוע ההמלצות של האתר התחיל להגיש לה סרטונים בעלי גישה יותר ויותר קיצוני. חיפוש סרטונים על צמחונות, למשל, הובילו לסרטונים על טבעונות. חיפוש סרטונים על ריצות קלות הובילו לסרטונים על מרתוני-אולטרה. וזה כמובן גם היה המצב בנוגע לנושאים פוליטיים שתמיד התפתחו מהמתון עד הקיצוני. היא כותבת:
What we are witnessing is the computational exploitation of a natural human desire: to look “behind the curtain,” to dig deeper into something that engages us. As we click and click, we are carried along by the exciting sensation of uncovering more secrets and deeper truths. YouTube leads viewers down a rabbit hole of extremism, while Google racks up the ad sales.

YouTube, the Great Radicalizer

טופקי איננה טוענת שראשי YouTube (או מנהלי חברת האם Google) קושרים קשר כדי להקצין כל דבר. היא רואה בזה תוצאה כמעט בלתי-נמנעת של תפיסה שמבקשת להמשיך לגרום לנו להקליק על עוד ועוד סרטונים כדי להגדיל את הכנסות החברה מפרסומות. גם כך, מדובר במצב מאד בעייתי.

אתם נהנים … אנחנו מרוויחים

אני מודה, זאת איננה תלונה. אינני יכול להתלונן על כך שגוגל מחפשים דרכים להרוויח מ-YouTube, ואם הם עושים זאת תוך כדי כך שהם מקנים לי הנאה, מה רע בזה? ואפשר להוסיף שבעצם, עד עכשיו YouTube לא הצליח להפוך את מאות מיליוני הביקורים אצלו לרווחים, ואולי בגלל זה גוגל יכלו לחשוב שזה הופך את המיזם ללא כדאי.
והנה, בעקבות סרטון שזכה למיליוני צפיות תוך שבוע אנחנו מגלים שאולי יש אפשרות להרוויח.

One of our main goals at YouTube is to help content creators effectively make money from the distribution of their content online. That they can do so in a way that brings artists and our community together to create fun, spontaneous and inspiring works, is one of the best and most exciting things about YouTube.

        I now pronounce you monetized: a YouTube video case study

אבל אולי מה שהכי מעניין בפוסט הקצר הזה בבלוג הרשמי של גוגל הוא שהפיסקה הקצרה המצוטטת כאן באה בסיום דיון על כיצד חברת סוני הרוויחה מסרטון ריקוד החתונה. לפי סדר הכתוב, החלק המרגש (לפי דבריהם) בא רק אחרי החלק הקשור לרווחים. וחשוב גם לזכור שהרווחים של חברת סוני באו לא מפני שהם תבעו את מי שהשתמש בשיר שעליו יש לה זכויות ללא אישור, אלא מפני שהם אישרו את השימוש … והצופים קנו את השיר.

מישהו כאן דיבר על למידה?

בבלוג הרשמי של גוגל מספר אחראים של מוצר Google Maps כותבים על פיתוחים חדשים במפות – במיוחד היכולת לא רק למפות מקומות אהובים, אלא להפוך את הנוכחות במפה לנוכחות וובית רחבה יותר. ובתוך הפוסט אנחנו קוראים:

It's estimated that 80% of U.S. Internet users use web search to find restaurants, stores and other local businesses, and yet only about half of local businesses currently have a website.

        Introducing a collection of favorite places from around the world

הקישור בתוך הציטטה מובילה לדוח שניתן להזמין (לא של גוגל) על השימוש באינטרנט אצל חברות קטנות. לא הזמנתי, ולא עד כדי כך מעניין אותי. אבל מה שכן מעניין הוא לשם מה גולשים משתמשים בווב. זה בוודאי לגיטימי לחפש מסעדה, אבל אני מניח שיש הרבה יותר חיפושים עבור מסעדות וחנויות מאשר "מידע" שעשוי להיות חלק מתהליך למידה.

ועוד על הכוונות שלי … וההבנה שלהם

כתבה ב-Technology Review על התופסות החדשות לחיפוש אצל גוגל מסיימת עם הידיעה שהם עושים מאמץ לתקן חיפושים שנבעו משגיאות באיות:

Finally, Google is making more of a push to correct misspelled searches–and to give you results for both your spelling and for a corrected spelling at the same time. A search for "SFLL playoffs" will thus give you two groupings on the same page. The first grouping will be results pertaining to NFL playoffs, on the assumption that this is what most people meant. But the second grouping will be for the San Francisco Little League playoffs. The decision to overrule the searchers' actual intent was a controversial one, researchers said, but was judged useful in most cases.

        Google Unveils Google Squared

אמנם ההחלטה להעדיף את מה שגוגל יודע מעל לכוונה של הגולש היתה "שנוייה במחלוקת", אבל לא היה קשה להחליט שבגוגל כנראה יודעים טוב יותר.

אבל כן התכוונתי למה שהקלדתי!

מפגש Searchology נערך לפני כשבוע במתחם של גוגל. מספר אנשי גוגל הסבירו לעיתונאים על השינויים שמתרחשים בגוגל בנוגע לחיפוש, ותוצאות החיפוש שמוצגות לגולש. בדיווח ב-ReadWriteWeb בין היתר אנחנו קוראים:

Patrick Riley (מנהדס בגוגל)begins by saying "it's all about user intent." By tweaking the algorithm, and operating at scale, Google can update the search results page so that it offers results for not only the query, but for what Google thinks the query could be should what you typed into the search box be incorrect.

        Searchology: State of the Union of Search at Google

מצד אחד, יש כאן דבר חיובי – גוגל מסוגל לנחש שאייתנו מילה בצורה לא נכונה, למשל. אבל ההמנויות שנמצאת ביסוד ההצלחה של גוגל מתגלה כאן גם כסכנה. אם אחרים חיפשו משהו, אז כנראה גם אתה רצית את אותו הדבר. לפחות בחינוך אפשר לקוות שכל אחד מחפש משהו ייחודי, ואין צורך (או טעם) שגוגל יציע לי מידע על משהו שונה ממה שחיפשתי.

כאשר לא מבינים את הטכנולוגיה

סיבה ויידיאנתן, בבלוג The Googlization of Everything מספר סיפור על United Airlines ועיתונאי שחשב שמידע שהוא מצא דרך גוגל היה מידע עדכני. מתברר שהסיפור שהוא מצא התרחש מספר שנים לפני שהוא מצא אותו, אבל זה לא מנע בלגן בבורסה.

This simple glitch cost UAL shareholders – including most of its employees – 11.2 percent of its market value. In addition, the panic sent shares of two other airlines, Continental Airlines and AMR (parent of American Airlines) down as well. The airlines had done nothing wrong. They had released no bad news. Yet they were all worth less at the end of the day than at the beginning because Google's Web crawlers found a mislabeled story in an open newspaper archive.

        Comments, please: A slice of the introduction draft

ויידיאנתן מסביר שהירידה הפתאומית בערך המנייה נבע מהפצת הסיפור שנמצא דרך גוגל, אבל גולה לא עשתה שום דבר רע או לא בסדר. הוא מוסיף שבוודאי שבגוגל אי אפשר היה לחזות את הטפשות שאפיינה את ההתנהגות של כל הגורמים בהתפתחות הסיפור, אם זאת, הוא מצביע על התלות שלנו במערכות שאנחנו כנראה עדיין לא מבינים.

ואולי המקורות מצטמצמים

ניקולס קאר סוקר עשרה נושאים שאחריהם הוא עוקב כבר כמעט שנתיים וחצי בגוגל. הוא מגלה שנכון לעכשיו, עבור כל העשרה התוצאה הראשונה בגוגל היא לערך בוויקיפדיה:

The next thing to be said is: what we seem to have here is evidence of a fundamental failure of the Web as an information-delivery service. Three things have happened, in a blink of history's eye: (1) a single medium, the Web, has come to dominate the storage and supply of information, (2) a single search engine, Google, has come to dominate the navigation of that medium, and (3) a single information source, Wikipedia, has come to dominate the results served up by that search engine. Even if you adore the Web, Google, and Wikipedia – and I admit there's much to adore – you have to wonder if the transformation of the Net from a radically heterogeneous information source to a radically homogeneous one is a good thing. Is culture best served by an information triumvirate?

        All hail the information triumvirate!

קשה לא להסכים עם קאר שמה שיש כאן הוא כשלון יסודי של הווב כשרות להגשת מידע.

ומה לגבי גישה חופשית?

רוברט דרנטון, בין היתר המנהל שהספריות של אוניברסיטת הרווארד, סוקר את האווירה התרבותית של המאה ה-18. הוא מוצא פריחה ופתיחות תרבותית, אבל גם צד פחות מלבב:

The personal conflicts were compounded by social distinctions. Far from functioning like an egalitarian agora, the Republic of Letters suffered from the same disease that ate through all societies in the eighteenth century: privilege. Privileges were not limited to aristocrats. In France, they applied to everything in the world of letters, including printing and the book trade, which were dominated by exclusive guilds, and the books themselves, which could not appear legally without a royal privilege and a censor's approbation, printed in full in their text.

        Google & the Future of Books

בהמשך הוא בוחן את ההסכם שהושג עם גוגל בעניין הדיגיטאציה של ספריות אקדמיות, ומעלה שאלות קשות בנוגע לעתיד הנגישות החופשית.