התייצבות במצב הרידר

פורסם ע"י בצלאל ב1 ביולי, 2008

החודש האחרון הביא איתו מספר שינויים שערכתי בגוגל רידר שלי, ועכשיו המצב נראה כך:

From your 149 subscriptions, over the last 30 days you read 8,419 items, starred 36 items, shared 33 items, and emailed 4 items.

אז מה קרה מאז החודש הקודם?

הסיבה להכפלה במספר הפריטים הנקראים היא באופן אירוני דוקא ההיפטרות מכמה פידים שהציפו אותי בעדכונים אשר רובם לא עיניינו אותי, מה שגרם לי לבזבז עליהם המון זמן בקריאת כותרות (שלא אפספס איזו פנינה בים הזבל), ולסמן רשימות ארוכות של עדכונים כנקראו למרות שלא באמת קראתי אותם. כנגד הפידים המציפנים שהועפו, הוספו מספר פידים מעניינים יותר, והתוצאה היא שיותר מעניין לי לעבור בניחותא על רשימת העידכונים שלי (למרות שאני עדיין לא קורא הכל עד הסוף).

הבעיה שאני מתמודד איתה עכשיו היא סימון של פריטים (בדרך כלל ארוכים או עמוקים במיוחד) לקריאה מאוחרת, בלי שאני באמת מגיע לקרוא אותם בסופו של דבר. הרבה יותר נחמד לקרוא את שמונת העדכונים שהגיעו הרגע טריים מתנור הרסס מאשר לחזור לפוסט פילוסופי/היסטורי ארכני מלפני שבוע.

סוגיה נוספת ובעייתית מסיבותיה שלה, היא הפידים המשותפים, כמו זה של שרון למשל. בניגוד לפיד קוהרנטי שאפשר לזהות דיי מהר אם הוא מעניין אותי ואם אני רוצה אותו ברידר שלי, פידים מהסוג הזה מציגים סוגים שונים של תוכן באריזה אחידה. מכיוון שכל אחד מהאנשים המשתפים מכניס תוכן שמעניין אותו אישית, יכול להיות שחלק מהם יהיו לטעמי וחלק אחר ישתפו דברים שאין לי מה לעשות איתם. יצירת פיד משותף כזה היא רעיון מעולה בעיני, אבל הקריאה שלו מצריכה ממני הרבה יותר משאבי סינון מאשר פידים רגילים.

מכיוון שתוך כדי הכתיבה אני ממשיך לקרוא עדכונים (כבר 8,442), אני יכול להתיחס לאמירה של אום מאליק שהגיעה הרגע, ולומר שלפחות מבחינתי הבעיה היא שרק אני יודע להחליט מה באמת מעניין אותי. שום רשימה של קטגוריות או תגיות תוכל לעשות את זה במקומי, וזה ידידיי, האתגר הבא של עידן המידע.

Technorati Tags: , , , ,

הצדדים הירוקים והחמים של אינפלציית המידע

פורסם ע"י בצלאל ב31 במרץ, 2008

אני אוהב לכתוב על עידן המידע, ואני אוהב לכתוב על נושאים סביבתיים, והנה מסתבר שאפשר לכתוב פעם אחת על שני הדברים יחד.

כידוע, כמות המידע בעולם רק הולכת וגדלה בקצב הולך וגדל. מאחר ויש צורך לאכסן את כל המידע הזה איפשהו, גם כמות חוות השרתים גדלה ואיתה כמות האנרגיה שנצרכת, הן ישירות על ידי השרתים והן על ידי אמצעי הקירור שיש צורך להפעיל בסביבתם כדי לשמור על פעולה תקינה. מכיוון שאנרגיה היא מוצר שהולך ומתייקר, החלו חברות בעלות מרכזי מידע גדולים לחפש אלטרנטיבות.

אחת הזוכות הגדולות היא איסלנד, כאשר הסיבות הן שילוב של עתודות קרקע פנויות, אקלים קר, והעובדה ש-90% מצריכת האנרגיה של איסלנד מופקת ממקורות מתחדשים (בעיקר אנרגיה הידרו-אלקטרית וגיאוטרמית) - מה שמנתק את משק האנרגיה שלה מתלות במחירי הנפט.

מסקנה:
אמנם אין לישראל אקלים קר במיוחד וגם לא ניצול מוצלח במיוחד של אנרגיה גיאוטרמית או הידרואלקטרית, אבל כן יש לנו מומחיות עולמית בניצול אנרגיית שמש (שעד שהיא תיגמר כבר לא יהיה כאן אף אחד שיהיה לו אכפת), ויש לנו מדבר דל אכלוס, עשיר ביישובי פיתוח מוכי אבטלה, וטובע בשמש בלתי מנוצלת.
אם עד היום היה כדאי להשקיע באנרגיית השמש בגלל התועלת הישירה שלה למשק האנרגיה הישראלי ולצמצום התלות בנפט והפחם היקרים והמזהמים, עכשיו יש עוד סיבה: זוהי הזדמנות להפוך את ישראל למעצמת אכסון מידע.

Technorati Tags: , , , ,

מי משלם עבור מהפכת המידע?

פורסם ע"י בצלאל ב12 במרץ, 2008

אחד הביטויים הכי חמים בשטח, חם כמעט כמו "web 2.0″, הוא "מהפכת המידע" או "עידן המידע", והמהדרין מוסיפים "חברת המידע".

את התהוותה של מהפכת המידע נהוג ליחס לפריצת האינטרנט, ובמיוחד ה-web, לחיינו באמצע שנות ה-90′ של המאה הקודמת. קיומה של הרשת ונגישותה לציבור אפשרו לראשונה שיתוף מאסיבי של כלל הידע האנושי; החל מפרסומים אקדמיים רבי חשיבות, דרך עיתונות יומית, וכלה בבלוגים זבי חוטם.
אם בעבר חיפוש מידע סבל ממיעוט מקורות, העדר עדכון שוטף ועלויות גבוהות, כיום הבעיה היא עודף מידע וכן יכולת מוגבלת להעריך את מהימנותו. מיזמים רבים הוקמו, וכספי משקיעים רבים הוצאו, במטרה לשפר את היכולת לדלות מידע מהרשת ולספק לצרכני המידע כלים לברירת המידע הרלוונטי והערכת מהימנותו.

למעשה, מהפכת המידע החלה לפני זמן רב - עם המצאת הדפוס באמצע המאה ה-15. עד אז מצבור הידע האנושי היה אצור בכתבי יד נדירים ויקרים, אשר היו נגישים רק לאצולת הכנסיה. המצאת טכנולוגיות המחשוב, האחסון האלקטרוני והרשת הציבורית הן רק התפתחויות מאוחרות של אותה מהפכת מידע בת ארבע מאות שנה. נכון, היקף המידע הקיים גדל באופן חסר תקדים במאה השנה האחרונות, אבל ההתנהגות האנושית בהקשר אליו כמעט ולא השתנתה עד לאחרונה.

בעשור האחרון אנחנו עדים לתופעה מאוד מעניינת והרבה פחות מדוברת מאשר מהפכת המידע עצמה, אשר במסגרתה משתנה האופן שבו אנו צורכים שירותי מידע.

בתחילת דרכה של הרשת הציבורית, שירותי המידע שהיא הציעה התבססו על השיטה הרווחת ברוב השווקים האחרים: הצרכן המעוניין בשירות או במוצר משלם לספק או ליצרן ומקבל בתמורה את המוצר שחפץ בו. כך למשל, עד שלהי שנות ה-90 נהגו ספקיות שירותי המידע CompuServe ו- AOL לגבות תשלום קבוע מהמנויים תמורת הגישה לשרתים שלהן. באותה תקופה היו גם חברות ישראליות שניסו את השיטה הזאת, ביניהן TvTel (שירות שניסה לחקות את הצלחת ה- MiniTel הצרפתי ולהציע מעין פורטל קניות מקוון למנויים) וכמובן IOL זצ"ל. המודל הכלכלי של ספקי המידע היה מסורתי, ולא התאים לתנאים המתהווים ביקום האינטרנט.
כאשר צרכן נדרש לשלם מראש עבור הגישה למאגרי המידע ושירותי התוכן, אין לו למעשה יכולת לדעת האם מאחורי דרישת התשלום עומדת יכולת מוכחת לספק את המידע הדרוש. הפריצה הגדולה של האינטרנט להמונים טרם התרחשה, וציבור הצרכנים הפוטנציאלי היה ספקן בנוגע לנחיצותו של מנוי לשירותי מידע בחייו.

כך עברה הרשת למודל תשלום שהושאל מתעשיית הטלויזיה אך התפתח הרבה מעבר לאופי הראשוני שלו. לפי המודל הזה, צרכני התוכן אינם משלמים עבור המידע שהם צורכים; או שהמידע מוצע בחינם, או שהצרכן נדרש לצפות בנוסף לתוכן שביקש גם בתוכן שספק המידע בחר עבורו. זה יכול להיות תוכן פרסומי טהור (למשל כרזת פרסומת לאבקת כביסה), זה יכול להיות פרסום עצמי של ספק המידע (אם חיפשת מסוג X, דע לך שיש לנו גם מידע מסוג Y) ועוד. המכנה המשותף לכולן הוא שצד שלישי נושא בעלות העברת המידע מהיצרן לצרכן - זהו כמובן המפרסם.

למעשה, אותו "מפרסם" הוא בדרך כלל לא ישות אחת אלא אוסף של חברות פרסום אשר מייצגות, כל אחת, מספר מפרסמים, ומפיצות את התוכן הפרסומי שלהן באופן רוחבי ברשת. את אותו סט של פרסומות לאבקת כביסה, מכוניות, קופות גמל וקורנפלקס אני אפגוש גם באתר החדשות החביב עלי, גם בפרופיל של חברים ברשת החברתית שלי, גם בבלוגים של חברים שלי וגם במסגרת שירות הדואל-רשת החינמי שלי. עבור כל אחד מהשירותים האלה הייתי אמור, לו היינו משתמשים במודל המסורתי, לשלם בנפרד מכספי.

העובדה שבחברת המידע אנחנו רוכשים שירותים שמישהו אחר משלם עליהם הפכה למובנת מאליה, גם אם לא כל צרכני המידע מבינים אותה לעומקה. אנחנו משלמים על המידע שמעניין אותנו בקבלת מידע עודף שלא בהכרח מעניין אותנו, ובכך מעצימים את הבעיות בחיפוש המידע אותן הזכרתי בתחילת הרשומה.

אך מדוע שיטה זו לא  מתפשטת גם לשווקים אחרים? מדוע הספר שלי לא מעניק לי תספורת בתמורה לצפייה בפרסומות של ג'ל לשיער? מדוע חברת הטלפון לא מצליחה לקדם שירותים של שיחות טלפון בתמורה לפרסומות מתפרצות?
התשובה, לדעתי, נעוצה בעובדה שבעולם המידע הצרכן אינו יכול לדעת אם התמורה שיקבל עבור כספו תביא לו תועלת, ולפעמים הוא בכלל לא יודע מהי התמורה שיקבל. ביני לבין הספר שלי יש הסכם האומר שהוא יספר אותי לשביעות רצוני, אחרת הוא יוותר על התמורה או יבצע תיקון על חשבונו. ביני לבין חברת הטלפון יש הסכם האומר שכאשר אני מחייג מספר אקושר אל המנוי שהמספר שייך לו. נניח שפייסבוק היתה גובה תשלום חודשי, האם מישהו מעלה בדעתו שהיו מחזירים לו כסף לו לא היה מוצא חברים?

נניח שהמאמצים של מנועי חיפוש, סטארטאפים ושאר מיזמים ישאו פרי ויתנו בידנו כלים לדלות רק מידע רלוונטי ומהימן מתוך בליל המידע הקיים ברשת הציבורית, האם לאחר שהתרגלנו לצרוך מידע מבלי לשלם עליו יחזור הגלגל לאחור ומודל התשלום הקלאסי ישוב לשימוש?
הרי גם היום נשארו "איים" של ספקי מידע המציעים וודאות גבוהה מספיק שתמצא בהם את מה שאתה מחפש כדי להרשות לעצמם לגבות תשלום בכניסה, ואלו הם בעיקר ספקי מידע של מאמרים אקדמיים או אנציקלופדיות מקוונות כמו הבריטניקה ירום הודה.

מרכיב נוסף שעשוי להשפיע על התשובה לשאלה הזאת הוא ההתפתחות האבולוציונית שעבר מודל הפרסום הטלוויזיוני לאחר התאמתו לאינטרנט. אני מתכוון כמובן למרכיב התשלום ששמו "ויתור על הפרטיות".
כמעט כל אתר אינטרנט אוסף ושומר פריטי מידע על המשתמשים בו. אלה יכולים להיות פריטים סטטיסטיים סתמיים כמו סוג הדפדפן של המשתמש, אבל גם פרטים מהותיים יותר בנוגע להתנהגות המשתמש: מאיזה אתר הוא הגיע, לאיזה אתר הוא המשיך, מה המאפיינים הדמוגרפיים שלו ואילו פעולות הוא ביצע במסגרת האתר. כמעט כל אתר כולל עמוד של "הצהרת פרטיות", אבל מעטים המשתמשים שמבינים את משמעות תוכנו, מעטים המשתמשים שקוראים אותו  - וגם כשקוראים, הדבר הרי נעשה לאחר שכבר נכנסת לאתר והוא אסף עליך מידע.
איסוף זה של מידע על הצרכן הוא תשלום נוסף עבור מתן השירות - מעבר לצפייה בתוכן הפרסומי, ומי שמרוויח ממנו הוא לעיתים רחוקות הצרכן עצמו. מידע זה משמש את האתר, למשל, להצגת פרסומות מותאמות אישית ומאפשר לו לקבל תשלום כספי גבוה יותר מהמפרסם.

שוב ושוב עולה מילת המפתח "מידע". אנחנו צורכים מידע, משלמים במתן מידע על עצמנו ובקבלת מידע עודף על אחרים. מידע הפך לסחורה הכי חמה והשליטה במידע למקור הכוח הכי גדול. מסתבר שהאתגר של חברת המידע הוא לא רק להתמודד עם עודף המידע והערכת מהימנותו, אלא גם להתמודד עם חוסר הבקרה המוחלט על המידע שנמסר ומתקבל בידי המשתמשים.

האם תהיו מוכנים לשלם מכיסכם עבור סביבת מידע שבה אין פרסומות משום סוג ומובטח שלא נאסף עליכם כל פרט מידע? או שעבור הנגישות למידע אתם מוכנים להשלים עם אובדן הפרטיות והפיכתכם לפריטי מידע בעצמכם?

Technorati Tags: , , , , , , , , ,

תוכן לא טקסטואלי: עקב אכילס של מנועי חיפוש

פורסם ע"י בצלאל ב6 במרץ, 2008

מספר הדפים באינטרנט נאמד ב[הכנס מספר עצום ובלתי נתפס כאן], וחברות ענק עתירות ממון נאבקות (טוב, לא ממש. גוגל דיי עוקפת את כולם בסיבוב, אבל אנחנו בדיון אקדמי היום) על היכולת להכיר את מירב הדפים האלה ולשלוף מתוכם את התוכן הכי קרוב למה שהאדם המחפש התכוון אליו. אבל כל ענקי החיפוש עוסקים בעצם בעיקר בשיפור הדיוק של תוצאות החיפוש, ולא מתמודדים עם הצורך לשפר גם את המיצוי.

אסביר:

דיוק - איזה חלק של המידע המאוחזר הוא רלוונטי למחפש.
מיצוי - איזה חלק מהמידע הרלוונטי הקיים אוחזר במסגרת החיפוש.

כל מנועי החיפוש שאני מכיר יודעים לקרוא רק טקסט. גם כאשר מחפשים ומוצאים סוגים אחרים של מדיה (תמונות, פלאש, וידאו, סאונד) הדבר נעשה או באמצעות הצמדת תיאור טקסטואלי לפריט, למשל באמצעות תיוג, או על ידי התיחסות לטקסט המופיע בסביבת הפריט, למשל תוכן של כתבה בה משולבים וידאו ותמונה.

אם אחפש למשל "תמונה של ילד עם כובע", מנוע החיפוש לא יודע "לצפות" בתמונות, לנתח את הפרטים שמופיעים בהן, ולהחליט אם מדובר בילד או במבוגר, אם יש לו על הראש כובע או סתם ליפה, או אם מדובר בכלל בתמונת אילוסטרציה של חיזר עם אנטנה. אם מישהו צילם תמונה של ילד עם כובע אבל לא תייג אותה נכון (או בכלל), אין לי סיכוי להגיע אליה. אופן דומה, אם אני מחפש קטע מוקלט של הכרזת העצמאות, אין לי סיכוי למצוא אותו אלא אם הוא מופיע בתוך אייטם טקסטואלי שמדבר על הכרזת העצמאות, או שמי שהעלה את הקטע לרשת תייג אותו כראוי.
מנוע החיפוש גם יתקשה להחליט אם התמונה שהוא מוצא היא תמות אילוסטרציה, תמונת פפרצי, תמונה של צלב חובב, או תמונת יח"ץ רשמית.

פן נוסף של אותה בעיה הוא שמנוע החיפוש גם לא יודע לזהות "זהות" של פריטים. כלומר, אם אני מחפש למשל מידע על אדם מסוים במטרה ליצור איתו קשר, תוצאות החיפוש שיעזרו לי ביותר יהיו כנראה עמודי הפרופיל שלו ברשתות חברתיות שונות. אבל מנוע החיפוש לא יודע לזהות את העמודים האלה כ"עמודי פרופיל", אלא לכל היותר כעמודים שהשם המבוקש מופיע בכותרת שלהם. באותה מידה החיפוש יכול להחזיר תוצאות של כתבות בעיתונות שנעשו על האדם הזה, או אייטמים בבלוגים שהתיחסו אליו. שוב, זיהוי אופיו של הפריט נעשה רק בהתאם למידע הטקסטואלי שצורף אליו.

אני לא יודע אם היקף התוכן הלא טקטואלי מתקרב להיקף התוכן הטקסטואלי ברשת (יש לי תחושה שלא), אבל היכולת של מנועי החיפוש הקיימים לאחזר אותו מוגבלת ביותר.

מסקנות:
א. הקפידו לתייג את התוכן שלכם בקפידה.
ב. אם אני טועה אשמח לקבל קישור רלוונטי, ואם לא - אולי מישהו ירים את הכפפה ויפתח את הטכנולוגיה הזאת?

Technorati Tags: , , , ,

© כל הזכויות שמורות למפת סיביות
FireStats icon ‏מריץ FireStats‏