اصطلاح «داده‌های بزرگ» مبنای گسترده‌ای‌ست که همۀ اطلاعات نهادها و افراد را پوشش می‌دهد و استخراج اطلاعات یکی از راه‌های دسترسی به آن است.

تکنیک‌های داده‌کاوی به معنی کشف و آگاهی از داده‌هاست. به عبارت دیگر، به‌عنوان فرآیندی مؤثر برای استخراج داده‌های قابل استفاده از مجموعه‌ای بزرگ از داده‌های خام است که به معنی تجزیه و تحلیل الگوهای داده‌ها در مجموعه‌داده‌های بزرگ با استفاده از یک یا چند برنامه است.داده‌کاوی شامل برنامه‌های کاربردی در زمینه‌های چندگانه، مانند علم و تحقیق است، اما دولت‌ها و شرکت‌های بزرگ از برنامه‌های کاربردی داده‌کاوی برای یادگیری بیشتر دربارۀ کارکنان یا مشتریان خود استفاده می‌کنند و راهکارهای مؤثرتری را برای موفقیت برنامه‌های خود و استفاده از منابع از طریق جمع‌آوری اطلاعات، از طریق برنامه‌های الکترونیکی به‌کار می‌برند.

داده‌های بزرگ برای هر داده‌ای که از لحاظ کمی بزرگ است، استفاده می‌شود و زمانی که هر نوع داده‌ای دشوار باشد، برای درک آن از روش‌های سنتی در سیستم‌های مدیریت پایگاه داده، مانند مایکروسافت اکسل استفاده می‌شود.

استخراج داده‌ها اساساً فرایند «جست‌وجو برای یافتن سوزن در انبار کاه» است. این کار از طریق فرایند ورود به مجموعه‌های دادۀ بزرگ انجام می‌شود. داده‌کاوی برای تصمیم‌گیرندگان مهم است، زیرا به غربالگری مقدار زیادی داده برای تصمیم‌گیری‌هایی کمک می‌کند که با روند مورد نظر سازگار است.سیستم‌های کشورهای توسعه‌یافته -چه در سطح دولت‌ها و چه شرکت‌های تجاری بزرگ- از طیف وسیعی از ابزارهای نوآورانه نظارت و نظارت بر عملیات پیروی می‌کنند. برای نمونه، در خریدهای دولتی، به‌ویژه زمانی که دولت‌ها مناقصه برگزار می‌کنند، زمینه‌های مشکوک، الگوهای توافق‌نامه‌ها و اطلاعات دروغین یا جعلی را به‌وسیلۀ داده‌ها بازبینی، نظارت و بررسی می‌کنند. داده‌کاوی برای شناسایی «هدف فاسد» در پرداخت‌ها یا معاملات از طریق تجسم داده‌ای اطلاعات استفاده می‌شود.این نوع عملیات را محققانی انجام می‌دهند که در یک مرکز تحقیق فساد تخصصی و به منظور بررسی حجم زیادی از مجموعه‌داده‌های خرید عمومی متمرکز شده‌اند. روش آن‌ها دنبال‌کردن الگوهای غیرطبیعی، نظیر دوره‌های کوتاه‌مدت منصفانه یا نتایج غیرمعمول، نظیر عدم رقابت بیش از پیشنهاد یا پیشنهاد برنده‌شده از سوی شرکت به دست می‌آید.

ابزارهای ضدفساد برای تشخیص تقلب، ازجمله استفاده از نرم‌افزار در رایانه‌های غیرمعمول، جمع‌آوری مجموعه‌داده‌های بزرگ و رویه‌های اداری در برنامه‌های استخراج هوشمند اطلاعات، در دسترس هستند.

چگونه می‌توانیم از داده‌کاوی برای مبارزه با فساد استفاده کنیم؟

استخراج داده‌ها سبب برپایی «انقلاب داده‌ها» توسط جریان داده‌ها می‌شود، جایی که استفاده از تکنیک‌های داده‌کاوی در بخش خصوصی برای شناسایی اولویت‌های مشتری و پیش‌بینی الگوهای خرید به یک عمل معمول برای کسب‌وکارهای بزرگ تبدیل شده است. اما آیا می‌توان از داده‌کاوی برای مبارزه با فساد استفاده کرد؟ اگر چنین است، چگونه این اتفاق می‌افتد؟

در سال 2014 م در گرجستان، سازمان شفافیت بین‌المللی پایگاه پورتالی نظارت و تجزیه و تحلیل داده‌ها را راه‌اندازی کرد که از سایت‌های خرید الکترونیکی مؤسسات دولتی استخراج و دوباره در قالب‌های آسان برای استفاده، جمع‌آوری شده است.پورتال منبع باز شامل امکان فعال‌کردن کاربران (کارمندان دولتی) برای ایجاد پروفایل‌های تدارکات توسط سازمان‌های دولتی، پروفایل‌های شرکت‌هایی که طرف قراردادهای عمومی‌اند، و داده‌های آماری برای هزینه‌های دولت جمع‌آوری‌ شده است.کمیسیون اروپا در همکاری با سازمان شفافیت بین‌الملل برای تجزیه و تحلیل داده‌های خاص از داده‌های مختلف از مؤسسات عمومی و خصوصی و همچنین شناسایی پروژه‌هایی که در معرض خطر تقلب یا بی‌نظمی هستند، به منظور افزایش امکان کاوش داده‌ها و شناسایی کمبودهای در عملیات مربوط به مقامات منتخب و امور مالی دولتی، برنامه‌ای تولید کرده است.

برنامه‌های استخراج اطلاعات می‌توانند برای تشخیص تقلب مالیاتی و بهبود تطابق با مالیات‌دهندگان استفاده شوند. به‌طور مشابه، داده‌کاوی می‌تواند برای مبارزه با پول‌شویی مورد استفاده قرار گیرد، زیرا حساب‌های نرم‌افزاری اطلاعات بانکداری را بازمی‌گرداند و اطلاعات مربوط به داده‌های جنایی که ممکن است به شناسایی جریان‌های مالی غیرقانونی کمک کند، یک مسئلۀ بسیار مهم در برنامۀ سازمان شفافیت بین‌المللاست.

ثروت اطلاعاتی که امروزه می‌تواند با سنجش از راه دور جمع‌آوری شود، گزارش شهروندان از منابع جمعی، رسانه‌های خبری، داده‌های سرشماری، فعالیت‌های تلفن همراه، سایت‌های شبکه‌های اجتماعی و غیره، فرصت‌های زیادی برای استخراج داده‌ها ارائه می‌دهد.

ما نمی‌توانیم بدون مرکزی برای تجزیه و تحلیل داده‌ها بر توسعۀ ملی نظارت داشته باشیم، سیاست‌گذاران نیز نمی‌توانند تصمیم درستی در قبال سیاست‌های مورد استفاده توسط نهادهای دولتی را جز با استخراج داده‌ها در برنامه‌ریزی اتخاذ نمایند.

برای رسیدن به این هدف، داده‌های بزرگ را می‌توان تجزیه و تحلیل کرد و اطلاعات را برای شناسایی و جلوگیری از فساد، آن‌هم با همکاری دانشمندان اطلاعات و مؤسسات ضد فساد برای توسعۀ برنامه‌های کاربردی نرم‌افزار هوشمند استخراج نمود  و پس از آن تجزیه و تحلیل قدرتمند ضد فساد را منتشر کرد.

برای نمونه، دولت هند از درخواستی الکترونیکی به نام (من رشوه پرداخت کردم)  استفاده می‌کند که اجازه می‌دهد شهروندان برخورد با رشوه‌خواری و تقلب کارمندان و مقامات دولتی را گزارش دهند. این برنامۀ الکترونیکی کمک کرده است تا با فساد اداری موجود در چرخه‌های اداری برخورد شود؛ چنین نهادهای دولتی به اکثر شهروندان آسیب می‌رساند.

در برزیل، دولت از برنامۀ نظارت و تجزیه و تحلیل ویژه‌ای برای ردیابی هزینه‌های عمومی در شناسایی تقلب در بزرگ‌ترین برنامۀ رفاه اجتماعی استفاده کرده است. این کار  با مقایسۀ لیستی از ذی‌نفعان به ادارۀ فدرال اتومبیل و شناسایی هزاران نفر از مزایای نامعقول، انجام می‌شود.

انجمن اقتصاد جهانی تخمین می‌زند که هزینۀ فساد به بیش از 5درصد از تولید ناخالص داخلی جهان می‌رسد و سالانه بیش از 1تریلیون دلار رشوه پرداخت می‌شود. داده‌کاوی یکی از مؤثرترین ابزارها در تعیین معاملات مرتبط با این رفتار غیرقانونی است. در اغلب مطالعات تقلب و فساد در حال حاضر، برای جمع‌آوری اطلاعات خام از سیستم‌های ERPبرای پیدا‌کردن ناهنجاری‌ها استفاده می‌شود.

در تجزیه و تحلیل نهایی، عراق به مرکزی برای جمع‌آوری و تجزیه و تحلیل داده‌ها برای شناسایی نقاط ضعف در مؤسسات دولتی و خصوصی احتیاج دارد. این مراکز به استخدام و تجزیه و تحلیل اطلاعات نیاز دارند؛ سازمان شفافیت بین‌الملل می‌تواند در ایجاد چنین مرکزی کمک کند. دولت نیز می‌تواند برای رسیدن به هدف مورد نظر در مبارزه با فساد با شرکت‌های متخصص بین‌المللی همکاری کند.

اشتراک گذاری
دارای مدرک لیسانس در رشته آمار از دانشگاه موصل، لیسانس علوم رایانه‌‌ای از دانشگاه دوبلین، و دیپلم عالی از موسسه فناوری دوبلین، وفعالت‌‌های علمی و تحلیلی او سیاست و اقتصاد در ترکیه و کشورهای حوزه خلیج فارس را دربرمی‌‌گیرد.