يعدُّ مصطلح البيانات الكبيرة القاعدةَ الواسعةَ التي تشمل كل البيانات المتعلقة بالمؤسسات والأفراد، أما عملية استخراج البيانات فهي إحدى وسائل الوصول إلى المعلومات.

وتقنيات استخراج البيانات تعني اكتشاف ما في البيانات ومعرفتها، وبكلمة أخرى: تعرف على أنها عملية تستخدم لاستخراج البيانات القابلة للاستخدام من مجموعة كبيرة من البيانات الخام، بما يعني من تحليل أنماط البيانات في مجموعات البيانات الكبيرة باستخدام برنامج واحد فأكثر.

وتحتوي عمليات استخراج البيانات على تطبيقات في مجالات متعددة مثل العلوم والأبحاث، لكن الحكومات والمؤسسات التجارية الكبرى تستخدم تطبيقات استخراج البيانات لمعرفة مزيد من المعلومات عن موظفيها أو زبائنها وتطوير استراتيجيات أكثر فعالية لإنجاح برامجها والاستفادة من الموارد بطريقة أكثر مثالية، عبر جمع البيانات وتخزينها، ثم معالجتها عبر برامج إلكترونية.

والبيانات الكبيرة مصطلح يستخدم لأي بيانات كبيرة من حيث الكمية، ويشار إليها عند أي نوع من البيانات التي يصعب استيعابها باستخدام الأساليب التقليدية في أنظمة إدارة قواعد البيانات مثل مايكروسوفت إكسل.

أما استخراج البيانات فهي أساساً عملية “البحث عن إبرة داخل كومة قش” من خلال عملية الدخول إلى مجموعات البيانات الكبيرة. وتعدُّ عمليات استخراج البيانات مهمة لصانعي القرار لأنها تساعد في غربلة كميات كبيرة من البيانات؛ من أجل التوصل إلى القرارات التي تتوافق مع التوجهات المنشودة.

وتتبع أنظمة الدول المتقدمة -سواء على مستوى الحكومات أو المؤسسات التجارية الكبيرة- مجموعة من الوسائل المبتكرة لمراقبة العمليات والإشراف عليها؛ فمثلاً: في المشتريات العامة يُنقّب عن البيانات لمراجعتها، ومراقبتها حين تصدر الحكومات العطاءات وتحدد المناطق المشبوهة أو أنماط التواطؤ والمعلومات الخاطئة أو الملفقة. وتُستخدم عمليات استخراج البيانات لتحديد “النية الفاسدة” في الدفعات أو المعاملات من خلال التصور البياني للبيانات.

وهذا النوع من العمليات يجريها باحثون مختصون في “مركز أبحاث خاص بشؤؤن الفساد” لفحص كميات ضخمة من مجموعات البيانات الخاصة بإجراءات المشتريات العامة، من خلال البحث عن أنماط غير طبيعية مثل فترات العطاءات القصيرة الاستثنائية أو النتائج غير العادية -على سبيل المثال عدم وجود منافسة على العرض الفائز أو العروض التي فازت بها الشركة نفسها-.

وهناك أدوات برمجية لمكافحة الفساد مختصة للكشف عن عمليات الاحتيال، بما في ذلك استخدام برامج على حاسبات متطورة “غير الاعتيادية” واستيعاب مجموعات البيانات الكبيرة والإجراءات الإدارية ضمن برامج “الاستخراج الذكي للمعلومات”.

كيف يمكننا استخدام عمليات استخراج البيانات لمكافحة الفساد؟

يؤدي استخراج البيانات إلى إشعال “ثورة البيانات” الناتجة عن تفجير تيارات من البيانات، حيث أصبح استخدام تقنيات استخراج البيانات في القطاع الخاص لتحديد تفضيلات الزبائن والتنبؤ بأنماط الشراء ممارسةً شائعةً لدى المؤسسات التجارية الكبرى. ولكن هل يمكن استخدام عمليات استخراج البيانات لمكافحة الفساد؟ وإذا كان الأمر كذلك، كيف يحصل؟

في جورجيا وفي عام ٢٠١٤ أطلقت منظمة الشفافية الدولية بوابة مفتوحة المصدر لمراقبة البيانات وتحليلها، التي تستخرجها من موقع المشتريات الإلكترونية للمؤسسات الحكومية وتُعيد تجميعها في أشكال سهلة الاستخدام.

وتضمنت البوابة المفتوحة المصدر تمكين المستخدمين (من موظفي المؤسسات الحكومية) من إنشاء ملفات تعريفية لمعاملات الشراء التي تجريها الوكالات الحكومية، ولمحات عن الشركات التي تقدم العطاءات للعقود العامة، وبيانات إحصائية مجمعة للبحث عن الإنفاق الحكومي.

ولزيادة إمكانية استكشاف البيانات والكشف عن أوجه القصور في العمليات التي تشمل السلطات المنتخبة والمال العام، طوّرت المفوضية الأوروبية بالتعاون مع منظمة الشفافية الدولية برنامجاً خاصاً لتحليل البيانات يأخذ على عاتقه فحص البيانات من مختلف المؤسسات العامة والخاصة، ويساعد في تحديد المشروعات التي تتعرض لمخاطر الاحتيال أو المخالفات.

ويمكن استخدام برامج استخراج البيانات للكشف عن الاحتيال الضريبي وتحسين الامتثال لدافعي الضرائب. وبالمثل، يمكن استخدام استخراج البيانات لمكافحة غسيل الأموال حيث تُرجع الحسابات البرمجية البيانات المصرفية وتقارنها بمعلومات حول نقاط البيانات الجنائية التي قد تساعد في الكشف عن التدفقات المالية غير المشروعة، وهي قضية تحتل مكانة عالية في جدول أعمال منظمة الشفافية الدولية.

إن ثروة البيانات التي يمكن جمعها اليوم من خلال الاستشعار عن بعد، وتقارير المواطنين من مصادر جماعية، ووسائل الإعلام الإخبارية، وبيانات التعداد، ونشاط الهواتف المحمولة، ومواقع شبكات التواصل الاجتماعي وما إلى ذلك، توافر فرصاً كثيرة لاستخراج البيانات. ولا يمكننا مراقبة التنمية الوطنية دون وجود مركز لتحليل البيانات، ولا يمكن لصانعي القرار اتخاذ القرار الصحيح من السياسات التي ستعمل عليها مؤسسات الدولة ما لم يتم استخدام عمليات استخراج البيانات في التخطيط.

ولتحقيق ذلك، يمكن تحليل البيانات الكبيرة واستخراج المعلومات للكشف عن الفساد وردعه بتعاون علماء البيانات مع مؤسسات مكافحة الفساد لتطوير تطبيقات ذكية تقنية برمجية، ومن ثم نشر التحليلات القوية لمكافحة الفساد.

على سبيل المثال: تستخدم الحكومة الهندية تطبيق إلكتروني باسم (أنا دفعت رشوة) يتيح للمواطنين الإبلاغ عن حالات الرشوة والاحتيال في التعامل من قبل الموظفين والمسؤولين الحكوميين. وقد ساعد هذا التطبيق الإلكتروني على مواجهة الفساد عبر الدورات البيروقراطية اليسيرة التي تلحق الضرر بمعظم المواطنين عند مراجعتهم لمؤسسات الدولة.

وفي البرازيل، استخدمت الحكومة برنامجاً خاصاً للرصد والتحليل تتبع الإنفاق العام للكشف عن حالات الاحتيال في أكبر برنامج للرعاية الاجتماعية، من خلال مقارنة قائمة المستفيدين بسجل “السيارات الفدرالي” وتحديد الآلاف من المستفيدين غير المؤهلين.

ويقدّر المنتدى الاقتصادي العالمي أن تكلفة الفساد تصل إلى أكثر من ٥٪ من الناتج المحلي الإجمالي العالمي، مع دفع أكثر من ١ تريليون دولار في شكل رشاوى سنوياً. وتعد عمليات استخراج البيانات واحدة من أكثر الأدوات فعالية في تحديد المعاملات المرتبطة بهذا السلوك غير المشروع. ومن الشائع في معظم عمليات التحقيق في الاحتيال والفساد في الوقت الحاضر سحب البيانات الخام من أنظمة تخطيط موارد المؤسسات للعثور على الحالات الشاذة.

وفي المحصلة النهائية، يحتاج العراق إلى مركز لتجميع البيانات وتحليلها لتحديد مواقع الضعف في المؤسسات العامة والخاصة، وهذا النوع من المراكز يتطلب خبراء متخصصين في عمليات استخراج البيانات وتحليلها، ويمكن لمنظمة الشفافية الدولية تقديم المساعدة في إنشاء مثل هكذا مركز أو أن تتعاون الحكومة مع شركات عالمية كبرى متخصصة؛ لتحقيق الهدف المنشود في مكافحة الفساد.