כמה מחקרים נפגעים מ”תיקון שגיאות אוטומטי”? יותר משחשבתם

הרבה מאוד מילים נכתבו על המנגנונים האוטומטיים לתיקון שגיאות. מצד אחד, הם מקלים מאוד על העבודה שלנו ועוזרים לנו כדי לשמור על שפה תקינה; מצד שני, כמעט כל אחד מאיתנו נתקל לפחות פעם אחת בבעיה שנגרמה מתיקון שגיאה שלא הייתה קיימת. כמה פעמים שלחתם משהו שהיה שונה ממה שהתכוונתם לשלוח?

שמעו סיפור כיצד תיקון שגיאות אוטומטי באקסל, אחת התוכנות הפופולריות ביותר בעולם, פוגע במחקר בגנטיקה כבר לפחות 20 שנה:

אחת מהשיטות הנפוצות לסימון הגנים היא באמצעות כמה אותיות ואחריהן מספר. למשל, סיפרתי פה בעבר על “גן השפה” FOXP2 ו”גן האינטיליגנציה” KIRREL3. ב-2004 זיהו חוקרים אמריקאים שיש לא מעט קיצורים כאלה שבעת שכותבים אותם באקסל, התוכנה חושבת שמדובר בתאריך ומתקנת אותם אוטומטית. כך למשל, הגן DEC1 מתורגם מיד ל-1.12, וכך גם NOV2 ,SEPT5, MARCH3 ובעוד עשרות גנים נוספים.

ההתפתחות הטכנולוגית לאורך השנים מאפשרת לחוקרים לחשוב בגדול. כיום הם לא חייבים להתמקד בגן אחד, אלא ביכולתם לבצע מחקרים המכסים אלפים ולפעמים רבבות גנים. כשעובדים על כל-כך הרבה מידע, קצת קשה לעבור על כל הנתונים בעין אנושית ולראות שהוא מסודר בצורה נכונה, כפי שרצינו, מבלי שהתיקונים האוטומטיים יעשו תעלולים ויפגעו בתוצאות. ואכן, רבים מפספסים והטעויות מתגלגלות אל הממצאים. ב-2016 התפרסם מאמר שבחן כמעט 4,000 מחקרים שפורסמו בכתבי העת החשובים בעולם ונחשבים למעולים. ב-20% מהם התגלה לפחות גן אחד שהתיקון האוטומטי שינה את שמו בטעות.

אם חשבתם שהמחקר היכה גלים וגרם לקהילה המדעית לחשב מסלול מחדש, טעות בידכם. כעבור חמש שנים ביצעו אותם חוקרים בדיקה נוספת, הפעם של יותר מ-11,000 מחקרים, וגילו שיותר מ-30% מהם כוללים שמות שנפגעו בגלל התיקון האוטומטי. מיקרוסופט אמנם פרסמה בעצמה הבהרה בעניין והזכירה כי ניתן לשנות את הגדרות התיקון האוטומטי, והמערכת האקדמית אמנם החליטה לשנות את שמם.המקוצר של לא מעט גנים כך שהוא לא ידמה לתאריך, אך לא כל החוקרים מודעים לכך והטעויות נמשכות.

אם כל הדברים הללו לא עוזרים, נראה שהגיע הזמן שהעולם המדעי יתחיל לחשוב על ניתוח מידע בכלים קצת יותר מתוחכמים מטבלאות הקלאסיות של אקסל. יש כיום בשוק שפות תכנות כמו פיית’ון, R ו-MATLAB הכוללות הרבה מאוד כלים מתקדמים לניתוח מידע. תופעת הטעויות הנגרמות בתיקון האוטומטי מחדדת את החובה להקפיד על כל פרט קטן בעת קיומו של מחקר ואת העובדה שהבעיות והשגיאות בממצאים מגיעות לפעמים ממקומות שלא ציפינו להם.

אני רוצה להודות לתומכי הפטריאון של הבלוג, ובראשם למתן רינג, עינבל רמות, מייקל קניגס ושרה עטיה, התומכים המובילים. אם התוכן עניין אתכם, אני מזמין אתכם להפוך גם לתומכים, לעזור ל”סיור מוחות” לצמוח ולקבל מגוון רחב של הטבות כמו תכנים בלעדיים, יכולת להשפיע על הנושאים וצפייה בפוסטים לפני כולם. פרטים נוספים כאן