عصير الكتب

الجزء الأول من تلخيص كتاب “قواعد البيانات الكبرى” تأليف :فيكتور ماير شونبرجر وكينيث كوكير

“قواعد البيانات الكبرى”
لندع البيانات تتحدث
في عالم تحكمه الضوضاء ويسيطر عليه الزحام، صارت الكلمة العليا للبيانات، وأصبحنا نرى ثمار العولمة وعالم المعلومات في كل مكان، فها نحن نرى كل شخص يحمل في جيبه هاتفًا محمولاً، وجهاز كمبيوتر في حقيبته، كما انتشرت نظم تكنولوجيا المعلومات في جميع مكاتب الشركات، والمنظمات، وحتى في المتاجر الصغيرة. لكننا لا نلاحظ المعلومات ذاتها ولا ندرك قيمتها. لقد بدأت البيانات والمعلومات، خلال الخمسين عامًا التي انتشرت فيها أجهزة الكمبيوتر في جميع أرجاء العالم، تتراكم بصورة أدت إلى نتائج جديدة ومختلفة.
هذا، ولا يعج العالم فقط بالمزيد من المعلومات الآن، أكثر من أي وقت مضى، بل نجد تلك المعلومات تنمو بصورة أسرع. وقد أدى تغيير الحجم إلى تغيير في الشكل، كما أدى التغيير الكمي إلى تغيير نوعي. وعليه، صاغت بعض العلوم مثل علم الفلك وعلم الهندسة الوراثية، والتي شهدت بدايات هذه الطفرة خلال القرن العشرين، مصطلح ”قواعد البيانات الكبرى“، حتى انتشر في مجالات النشاط الإنساني كافة.
يشير مصطلح ”قواعد البيانات الكبرى“ إلى أمور يمكن للمرء القيام بها على نطاق واسع للتوصل إلى رؤى جديدة أو إيجاد صور مختلفة للقيمة بطرق تغير شكل الأسواق والمؤسسات والعلاقات بين المواطنين والحكومات.
بيد أن هذه ليست سوى البداية، إذ تتحدى قواعد البيانات الكبرى الطريقة التي نعيش ونتفاعل بها مع العالم. وما يبدو لافتًا للنظر هو ضرورة أن يتخلص البشر من اهتمامهم بالسببية ليركزوا على العلاقات الارتباطية بين البيانات: ويعني ذلك ألا يركضوا وراء
معرفة الأسباب، بل أن يركزوا فقط على معرفة ما يجري. يضع هذا التحول نهاية لقرون من الممارسات التقليدية، ويتحدى مفاهيمنا الأساسية عن كيفية اتخاذ القرارات وإدراك الواقع.
فضلاً عن ذلك، ستصبح قواعد البيانات الكبرى مصدرًا للقيمة الاقتصادية الجديدة وللابتكار والإبداع. ولكن ليس هذا كل ما في الأمر، بل تقدم قواعد البيانات الكبرى ثلاثة تحولات في طريقة تحليل المعلومات، والتي تغير كيفية فهمنا للمجتمع، والسبيل إلى تنظيمه. يتمثل التحول الأول في القدرة على تحليل كميات هائلة من البيانات الخاصة بموضوع ما، بدلاً من أن نضطر إلى معالجة مجموعات أصغر من تلك البيانات. وينطوي التحول الثاني على الاستعداد لاحتواء الفوضى التي يتسم بها العالم الواقعي للبيانات، بدلاً من تفضيل الدقة فحسب. أما التحول الثالث، فيتمثل في الاهتمام المتزايد بالعلاقات، أو بالارتباطات، بدلاً من السعي المستمر وراء السببية، أي معرفة الأسباب التي تؤدي إلى كل ظاهرة، والتي يعد إدراكها أمرًا بعيد المنال.
ليس ثمة مصطلح جامع مانع لوصف ما يحدث الآن أو يساعد على تخيل هذه التحولات والتغييرات سوى مصطلح ”التبيين“، والذي يشير إلى جمع المعلومات كافة حول كل ما هو تحت الشمس (بما في ذلك تلك التي لم يُنظر إليها قط بوصفها معلومات، مثل تحديد مكان شخص) وتحويله إلى صورة بيانات للاستفادة منها فيما بعد. يتيح لنا ذلك استخدام المعلومات بطرق جديدة، كما هو الحال في التحليل التنبؤي. ويمكننا، كنتيجة لذلك، الكشف عن القيمة الكامنة للمعلومات.
التحول الأول : الكثرة
تختص قواعد البيانات الكبرى برؤية وفهم العلاقات داخل مجموعات المعلومات وفيما بينها، والتي طالما حاولنا – حتى وقت قريب – فهمها بصورة كاملة. ويقول ”جيف جوناس“ الخبير بقطاع قواعد البيانات الكبرى بشركة ”آي بي إم“ إننا بحاجة إلى إتاحة الفرصة للبيانات كي تتحدث إلينا. في عالمنا الجديد هذا، يمكننا تحليل كم أكبر من البيانات. كما يمكننا، في بعض الحالات، معالجة البيانات كافة المتعلقة بظاهرة معينة. وقد اعتمد العالم منذ القرن التاسع عشر على استخدام العينات لتمثيل الأعداد الكبيرة؛ إذ
اتسمت تلك الفترة بندرة المعلومات بسبب القيود الطبيعية المفروضة على التعامل مع المعلومات في عصر اعتمد على التكنولوجيا التناظرية فحسب. لم نكن ننظر إلى العينات بوصفها قيودًا اصطناعية قبل انتشار الوسائل  التكنولوجية الرقمية عالية الأداء، بل كنا ننظر إليها بوصفها إحدى المسلمات. لقد أتاح لنا استخدام قواعد البيانات الكبرى معرفة تفاصيل لم نكن لندركها قط عندما كنا نقتصر على قواعد البيانات الصغيرة فحسب. وفضلاً عن ذلك، تمدنا قواعد البيانات الكبرى برؤية واضحة عن التفاصيل شديدة الدقة، مثل التصنيفات الثانوية والأسواق الفرعية، التي لا تستطيع العينات تقييمها.
التحول الثاني : الفوضى
يُعد استخدام جميع البيانات المتاحة أمرًا مجديًا في الكثير من السياقات. لكن هذا على حساب شيء آخر؛ حيث تؤدي زيادة حجم البيانات إلى عدم الدقة. وليس ثمة شك أن الأرقام الخاطئة والبيانات غير الصحيحة كانت دائمًا تتسلل إلى قواعد البيانات. غير أنه جرت العادة على التعامل معها بوصفها مشكلات، ومحاولة التخلص منها، ربما لأننا لم نكن نستطيع أن نفعل غير ذلك. ليس هذا فحسب، بل لم نكن أيضًا نريد أن نعتبر وجودها حتميًا، ونتعلم كيفية التعايش معها.
في الماضي، حين كان العالم يتسم بقواعد صغيرة للبيانات، كان الحد من الأخطاء وضمان الجودة العالية للبيانات دافعًا طبيعيًا وجوهريًا. لذا، فعندما كنا نجمع بعض المعلومات القليلة فحسب، لم يكن لدينا أدنى شك في أن الأرقام التي نهتم بتسجيلها دقيقة قدر الإمكان. وقد استفادت أجيال من العلماء من توظيف الأدوات المتاحة لديها للوصول إلى قياسات أكثر دقة، سواء كان ذلك لتحديد موقع الأجرام السماوية، أو لمعرفة حجم الأجسام تحت المجهر. وفي عالم كان يعتمد على استخدام العينات، كان الهوس بالدقة أكثر أهمية. فتحليل عدد محدود من البيانات قد يؤدي إلى أخطاء جسيمة، مما يقلل من دقة النتائج الإجمالية.
جدير بالذكر أن الفوضى، أو العشوائية، ليست متأصلة في قواعد البيانات الكبرى، بيد أنها تتعلق بعدم كفاءة الأدوات التي نستخدمها لقياس المعلومات وتسجيلها وتحليلها. فإذا وصلت التكنولوجيا إلى حد يتعذر معه احتمال الخطأ، ستختفي مشكلة عدم الدقة كليةً. ولكن ما دامت لم تدرك ذلك المستوى الذي يغيب معه احتمال وجود أي أخطاء، ستظل الفوضى واقعًا عمليًا يتعين علينا التعامل معه.
التحول الثالث : العلاقات الإرتباطية بالبيانات
قد تكون معرفة الأسباب وراء ما يحدث أمرًا جيدًا، بيد أنها ليست ضرورية لزيادة المبيعات، بينما تؤدي معرفة ما يحدث إلى تحقيق نجاحات. أدى هذا التحول من السببية للعلاقات الارتباطية إلى إعادة تشكيل العديد من الصناعات، وليس التجارة الإلكترونية فحسب. فقد تدرب مندوبو المبيعات في جميع القطاعات على فهم ما يريده عملاؤهم، حتى يستطيعوا معرفة الأسباب الكامنة وراء قراراتهم الشرائية. ومن ثم، حظيت المهارات المهنية وسنوات الخبرة بتقدير كبير، لكن تكشف قواعد البيانات الكبرى وجود نهج آخر أكثر واقعية.
تنبؤات وتفضيلات
تُعد العلاقات الارتباطية مفيدة في عالم البيانات الصغيرة، أما في سياق قواعد البيانات الكبرى فإنها تأتي بنتائج رائعة. فمن خلالها نستطيع استخلاص الأفكار بسهولة أكثر، وبصورة أسرع وأكثر وضوحًا من ذي قبل. وفي جوهرها، تقوم الارتباطات بتحديد العلاقة الإحصائية الكمية بين قيمتين. فإذا كانت هناك علاقة ارتباطية قوية بين مجموعتين من البيانات، يعني هذا أنه عند حدوث تغيير في قيمة إحدى هاتين المجموعتين، تطرأ على الأخرى تغييرات كبيرة. وعلى العكس، في حالة وجود علاقة ارتباطية ضعيفة، لا يؤثر التغيير الذي يطرأ على إحدى المجموعتين بدرجة كبيرة على الأخرى. ويمكننا تطبيق فكرة العلاقات الارتباطية، على سبيل المثال، على العلاقة بين طول شعر المرء وإحساسه بالسعادة، وعندها سنجد أن طول الشعر لا يمكن أن يعطينا فكرة عن سعادة المرء بأي حال من الأحوال. لذا لا تُعد تلك من العلاقات الارتباطية القوية.
تعطينا الارتباطات، أو العلاقات الارتباطية، فرصة لتحليل الظواهر، لا من خلال تسليط الضوء على ما يجري خلالها، بل عن طريق الوصول إلى متلازمات شديدة الارتباط بها. هذا، ولا تؤدي بنا الارتباطات إلى اليقين، بل إلى احتمالات فحسب. بيد أنه إذا كانت هناك علاقات ارتباطية قوية، يصبح احتمال وجود صلة بين مجموعتين من البيانات أمرًا مرجحًا. وإذ تتيح لنا الارتباطات فرصة تحديد متلازمة مرتبطة بإحدى الظواهر، نجدها تساعدنا في السيطرة على الحاضر والتكهن بالمستقبل: فإذا كانت الظاهرة (أ) غالبًا ما تتلازم مع حدوث الظاهرة (ب)، يتعين علينا مراقبة الظاهرة (ب)، حتى يتسنى لنا التكهن بحدوث الظاهرة (أ). فبالاستعانة بالظاهرة (ب) بوصفها متلازمة، يمكننا من خلالها معرفة ما قد يحدث مع الظاهرة (أ)، حتى وإن كنا غير قادرين على قياس أو مراقبة تلك الظاهرة بطريقة مباشرة. والأهم من ذلك أنها تساعدنا أيضًا في التكهن بما يمكن أن يحدث للظاهرة (أ) في
المستقبل. ولا تمكننا تلك الارتباطات، بطبيعة الحال، من التنبؤ بالمستقبل، بل تساعدنا على التكهن بإمكانية حدوث بعض الاحتمالات. غير أن تلك الإمكانية لها قيمتها التي لا ينبغي إغفالها.
يقدم لنا ما قامت به سلسلة متاجر ”ولمارت“ بالولايات المتحدة مثالاً توضيحيًا على هذا الأمر. فقد استعانت تلك المتاجر بمحاسبين متخصصين في العمليات الحسابية المعقدة من شركة ”تيراداتا“، للكشف عن الارتباطات القَيِّمة. في عام 2004 قامت الشركة بالتدقيق في قواعد البيانات العملاقة الخاصة بعملها في الأعوام السابقة: فراحت تبحث عن الأصناف الأساسية التي يشتريها كل عميل وإجمالي تكلفتها، بالإضافة إلى الأصناف الأخرى التي يشتريها، والوقت الذي يشتري فيه تلك الأصناف، بل وحتى حالة الطقس في ذلك الوقت. وقد لاحظت الشركة أنه في الأوقات التي تسبق الأعاصير مباشرة، لم تتزايد مبيعات الكشافات الضوئية فحسب، بل أقبل الزبائن أيضًا على شراء أحد أنواع الوجبات الخفيفة التي يتناولها الأمريكيون في الإفطار. ومن ثم، قامت شركة ”ولمارت“، مع اقتراب العواصف، بعرض تلك الوجبات الخفيفة في مداخل متاجرها بجوار الأصناف الأساسية التي
يشتريها عملاؤها قبل الإعصار، لتسهيل مهمة الشراء بالنسبة إلى العملاء، ولزيادة مبيعاتها في آن واحد. في الماضي، كانت إدارات الشركات تعتمد على التوقعات في جمع البيانات واختبار صحة الأفكار والمقترحات. أما الآن، يتوافر لدينا الكثير من البيانات والأدوات المتطورة، فصارت الارتباطات تلوح أمامنا بسرعة أكبر وبتكاليف أقل.
التحليل بإستخدام قواعد البيانات الكبري
في عالم لم يتوفر فيه سوى القليل من البيانات، كانت التحقيقات السببية والتحليلات الارتباطية تبدأ بفرضية يتم اختبارها لإثبات صحتها أو خطئها. ولكن نظرًا إلى أن كلا الأسلوبين كانا يعتمدان على فرضية، كان كلاهما عرضة للتحيز والحدس الخاطئ، ولم تكن البيانات اللازمة متوفرة في أغلب الأحيان. أما في يومنا هذا، ومع توفر الكثير من البيانات، وتوقع إتاحة المزيد منها في المستقبل، لم تعد مثل هذه الفرضيات حاسمة بالنسبة إلى تحليل العلاقات الارتباطية.
وثمة فرق آخر. فبسبب عدم توفر إمكانات حاسوبية كافية من ناحية، قبل توفر قواعد البيانات الكبرى، كانت معظم التحليلات الارتباطية التي تستخدم مجموعات البيانات الكبيرة تقتصر على البحث عن علاقات خطية، لكن الواقع أن العديد من العلاقات بطبيعة الحال أكثر تعقيدًا. أما من خلال التحليلات الأكثر تطورًا، يمكننا تحديد العلاقات غير الخطية بين البيانات.
على سبيل المثال: ظل رجال الاقتصاد وخبراء العلوم السياسية يعتقدون لسنوات طوال أن السعادة والدخل المرتفع متلازمان بصورة مباشرة: فإذا ما ارتفع دخل الفرد سيصبح أكثر سعادة. بيد أن البيانات تكشف ديناميكية أكثر تعقيدًا تحكم العلاقة بين هذين الأمرين. فقد أوضحت أن كل زيادة بالنسبة إلى بعض المستويات المتدنية من الدخل تُترجم إلى زيادة في شعور أصحاب هذه الدخول بالسعادة، ولكن بالنسبة إلى الدخول التي تزيد عن ذلك المستوى، فنادرًا ما تؤثر زيادة الدخل في شعور أصحابها بالسعادة.
فإذا ما أردنا التعبير عن تلك العلاقة من خلال رسم بياني، سنقوم برسم منحنى وليس خطًا مستقيمًا كما يظهر في التحليل الخطي. كان ذلك الاكتشاف مهمًا بالنسبة إلى واضعي السياسات. ففي حالة العلاقة الخطية، يصبح من المنطقي رفع جميع الدخول لتعزيز الشعور بالسعادة لدى الجميع. ولكن منذ اكتشاف العلاقات غير الخطية، صار من الأفضل التركيز على زيادة دخول الفقراء، إذ أظهرت البيانات أن ذلك سيأتي بنتائج أفضل.
في نهاية المطاف، تؤدي مثل هذه التحليلات، في عصر يتسم بقواعد البيانات الكبرى، إلى موجة من الرؤى الجديدة والتكهنات المفيدة. فسنرى صلات لم نكن ندركها من قبل، وسنستطيع فهم ديناميكيات اجتماعية وتكنولوجية معقدة كانت تغيب عنا. ولكن الأهم من ذلك هو أن هذه التحليلات غير السببية ستساعدنا على فهم العالم عن طريق طرح سؤال يتعلق بماذا يحدث، بدلاً من الاستفسار عن أسباب ما يجري.
نقلا عن www.edara.com
لقراءة الجزءالثاني إضغط هنا
تم نشر هذا المحتوي علي جريدة عالم التنمية برعاية
أكاديمية “بناة المستقبل” الدولية و” المنظمة الامريكية للبحث العلمي”
برئاسةأم المدربين العرب – الدكتورة “مها فؤاد” مطورة الفكر الإنساني
e5f2ef68-75e1-4678-9ffc-3479da505483
#بناة_المستقبل
#أكاديمية_بناة_المستقبل
#راعي_التنمية_بالوطن_العربي

اظهر المزيد

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى