مقایسۀ عملکرد شبکه‌های عصبی خود‌سازماندۀ مکانی و غیرمکانی در خوشه‌بندی داده‌های اجتماعی-اقتصادی بلوک‌های آماری شهر اصفهان

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری سنجش از دور و GIS، مرکز مطالعات سنجش از دور و GIS، دانشکدۀ علوم زمین، دانشگاه شهید بهشتی، تهران، ایران

2 استادیار مرکز مطالعات سنجش از دور و GIS، دانشکدۀ علوم زمین، دانشگاه شهید بهشتی، تهران، ایران

3 استاد مرکز مطالعات سنجش از دور و GIS، دانشکدۀ علوم زمین، دانشگاه شهید بهشتی، تهران، ایران

چکیده

امروزه با افزایش حجم و ابعاد داده‌های مکانی و نیاز به درک کامل داده‌ها، شبکه‌های عصبی خودسازمانده به ابزاری استاندارد برای کار با داده‌های بزرگ و چند‌بُعدی تبدیل شده‌اند که می‌توانند در خوشه‌بندی، بصری‌سازی و انتقال داده‌های چند‌بُعدی در فضایی با ابعاد کمتر استفاده شوند. هدف از پژوهش حاضر، خوشه‌بندی داده‌های بلوک‌های آماری (شامل ده متغیر منتخب اجتماعی-اقتصادی مرتبط با رویکرد توسعۀ پایدار شهری) با شبکه‌های عصبی خودسازمانده بدون استفاده از پارامترهای مکانی و به‌کارگیری مختصات جغرافیایی بلوک‌های آماری به‌عنوان پارامتر مکانی در روند خوشه‌بندی و مقایسۀ نتایج حاصل‌شده، است. الگوریتم SOM رایج‌ترین شبکۀ عصبی خودسازمانده و الگوریتم  Geo-SOMمکانی‌شدۀ الگوریتم SOM است. روند خوشه‌بندی هر دو الگوریتم یکسان است و تنها تفاوت این دو الگوریتم به‌کا‌رگیری پارامترهای مکانی در روند اجرای الگوریتم Geo-SOM است. در پژوهش حاضر داده‌ها با الگوریتم SOM و Geo-SOM خوشه‌بندی شده است. نتایج نشان داد که خوشه‌های حاصل از دو الگوریتم به‌طور کامل، متفاوت است. خوشه‌بندی بلوک‌های آماری بدون توجه به خصوصیات مکانی و تنها با استفاده از معیار شباهت، منجر به خوشه‌های ناهمگن می‌شود و برعکس. با اعمال پارامترهای مکانی نه‌تنها از معیار شباهت، از ویژگی‌های مکانی داده‌ها نیز در فرآیند خوشه‌بندی استفاده می‌شود که این مسئله منجر به تولید خوشه‌های همگن می‌شود. ارزیابی نتایج با استفاده از ضریب سیلهوته بیانگر خوشه‌بندی مناسب‌تر الگوریتم Geo-SOM است؛ به‌طوری که میانگین ضریب سیلهونه برای الگوریتم SOM برابر 02/0- و برای الگوریتم Geo-SOM برابر 27/ 0است. مقایسۀ نتایج نشان‌دهندۀ تأثیر مثبت پارامترهای مکانی در خوشه‌بندی داده‌های اجتماعی و اقتصادی است.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Comparing the Performance of Spatial and Non-Spatial Self-Organizing Neural Networks in Clustering Socio-Economic Data of Isfahan Census Blocks

نویسندگان [English]

  • Hadi Tarigholizadeh 1
  • Babak Mirbagheri 2
  • Ali Akbar Matkan 3
1 Ph.D. Student of Remote Sensing and GIS, Center for Remote Sensing and GIS Research, Faculty of Earth Sciences, Shahid Beheshti University, Tehran, Iran
2 Assistant Professor, Center for Remote Sensing and GIS Research, Faculty of Earth Sciences, Shahid Beheshti University, Tehran, Iran
3 Professor, Center for Remote Sensing and GIS Research, Faculty of Earth Sciences, Shahid Beheshti University, Tehran, Iran
چکیده [English]

 
Abstract
The increasing volume and dimensions of spatial data have made self-organizing neural networks a prominent tool for analyzing large and multi-dimensional datasets. Clustering, an approach for extracting knowledge from big data, aims to group similar data into clusters. This research focused on clustering socio-economic data of census blocks associated with urban sustainable development using self-organizing neural networks with and without spatial parameters referred to as SOM and Geo-SOM, respectively. Both algorithms employ the same clustering process but differ in the inclusion of spatial parameters, specifically the geographic coordinates of block centroids, in the Geo-SOM algorithm. The SOM and Geo-SOM algorithms were trained and applied to cluster the data. The resulting clusters exhibited distinct dissimilarities, demonstrating that clustering census block data solely based on non-spatial attributes leads to heterogeneous and incongruent clusters, whereas incorporating spatial parameters yields homogeneous and congruent clusters. Evaluation of the results using Silhouette coefficient indicated that Geo-SOM outperformed SOM in clustering the data with average Silhouette coefficients of -0.02 and 0.27 for SOM and Geo-SOM, respectively. Comparison of the outcomes highlighted the positive impact of incorporating spatial parameters on clustering socio-economic data.
Keywords: Self-organizing neural networks, SOM, Geo-SOM, Clustering, Spatial data, Census blocks, Isfahan City
Introduction
In recent years, there has been a significant increase in the volume of spatial data available. To gain a comprehensive understanding of spatial data, it is crucial to extract meaningful knowledge from it by considering its unique characteristics. This process, known as "Knowledge Discovery in Databases" (KDDs), utilizes methods, such as Artificial Neural Networks (ANNs) to extract useful information and knowledge. Clustering, a widely used technique for large-scale data analysis, aims to group similar data into clusters while reducing the data size and ensuring that the internal differences within clusters are significantly smaller than the differences between clusters. However, clustering algorithms for spatial data differ from those for non-spatial data. Therefore, this research focused on using self-organizing neural networks to cluster socio-economic data related to sustainable urban development while comparing the performance of two algorithms, SOM and Geo-SOM, for this task.
 
Methodology
This research utilized socio-economic data of Isfahan census blocks (2015) obtained from Iranian Statistics Center. The dataset consisted of 13,362 statistical blocks, each characterized by socio-economic variables. The SOM and Geo-SOM algorithms were employed to cluster the socio-economic data of census blocks and their results were compared. The self-organizing map is a single-layer feed-forward neural network that organizes output neurons in a low-dimensional topological structure. The SOM effectively maps high-dimensional data onto two-dimensional feature maps, forming networks of units or neurons. On the other hand, the Geo-SOM algorithm is an adaptation of the self-organizing map that incorporates a competitive learning process, focusing more on spatial aspects by restricting the search for the Best Matching Unit (BMU) to the geographical proximity of input patterns. Visualization tools, such as the U-matrix, Component Plane, and Hits Maps are employed to analyze the output of SOM and Geo-SOM algorithms. The network topology in this study was set to 7 x 7 after assessing multiple U-matrix sizes to identify clusters, resulting in a network with 49 neurons. Evaluation of the clustering results was performed using Silhouette coefficient, which measured similarity of the data within clusters and their dissimilarity between clusters.
 
Research Findings
The results obtained from this study revealed a fundamental distinction between the SOM and Geo-SOM algorithms, primarily stemming from their respective approaches to mapping input vectors onto network neurons, which in turn led to disparate clustering outcomes. Analysis of the component planes for both algorithms demonstrated notable variations in the relative weight assigned to each variable during the mapping process. Specifically, within the SOM algorithm, higher values of the variable of married population ratio tended to be associated with neurons corresponding to Cluster No. 4, while lower values exhibited a preference for neurons corresponding to Cluster No. 1. In contrast, the Geo-SOM algorithm assigned higher values of this variable to Clusters No. 8 and 9, with lower values predominantly allocated to Clusters No. 2 and 10.
The SOM algorithm yielded intertwined, heterogeneous, and scattered clusters when applied to the census block data. In contrast, the Geo-SOM algorithm achieved the classification of census block data into homogeneous and congruous clusters through the utilization of spatial parameters. Notably, the Geo-SOM algorithm exhibited a higher clustering quality as indicated by its average Silhouette coefficient of 0.27, surpassing the SOM algorithm's average Silhouette coefficient of -0.02.
 
Discussion of Results & Conclusion
This research employed two self-organizing map algorithms, SOM and Geo-SOM, to cluster census block data with the incorporation of spatial parameters. By integrating the geographic coordinates of census block centroids with other non-spatial inputs, we observed the positive impact of spatial parameters in the clustering process within the Geo-SOM algorithm. Comparatively, Geo-SOM exhibited superior performance, yielding cohesive and meaningful clusters of statistical blocks based on their similarities and spatial characteristics. The findings underscored the potential of the Geo-SOM algorithm in delineating homogeneous regions and identifying similar blocks within real-world datasets. We can conclude that utilization of this algorithm holds practical value for facilitating urban planning endeavors as it enables identification of homogeneous areas aligned with sustainable urban development principles and selected variables.
 
 

کلیدواژه‌ها [English]

  • Self-organizing neural networks
  • SOM
  • Geo-SOM
  • Clustering
  • Spatial data
  • Census blocks
  • Isfahan City

مقدمه

در سال‌های اخیر میزان داده‌های مکانی در‌دسترس به‌شدت افزایش یافته است. برای درک کامل داده‌های مکانی لازم است دانشی ساده و عمومی از داده‌های مکانی با در‌نظر‌گرفتن خصوصیات ویژۀ مکان استخراج شود. به فرآیند شناسایی الگوهای معتبر، جدید، مفید و قابل فهم در داده‌ها «کشف دانش در پایگاه داده» (KDD) (Knowledge Discovery in Database) گفته می‌شود (Fayyad, Piatetsky-Shapiro, & Smyth, 1996). کشف دانش جغرافیایی (GKD) (Geographic Knowledge Discovery) به‌معنای کشف دانش از روابط بین پدیده‌های جغرافیایی است که زیر‌مجموعۀ KDD است. یک مؤلفۀ اصلی در این فرآیند داده‌‌کاوی مکانی (SDM) (Spatial Data Mining) است که الگوها و روابط ناشناخته را در پایگاه داده‌های مکانی کشف می‌کند (Klösgen & Zytkow, 1996). با‌توجه به اهمیت و نیاز گسترده به دانش استخراج‌شده از داده‌های مکانی می‌توان گفت که 1- داده‌های با ابعاد بالا می‌تواند برای تفسیر و تجزیه‌و‌تحلیل چالش‌برانگیز باشد؛ 2- میزان محاسبات با ابعاد داده‌ها در ارتباط و تجزیه‌و‌تحلیل داده‌های با ابعاد بالا از‌نظر محاسباتی پر‌هزینه است؛ 3- روابط این داده‌های با ابعاد بالا به‌راحتی قابل تجسم نیست. خوشه‌بندی یکی از روش‌های استاندارد برای کار با مجموعه داده‌های بزرگ است؛ زیرا حجم داده‌ها را با یکی‌کردن داده‌های مشابه در گروه‌ها (خوشه‌ها) کاهش می‌دهد؛ به‌طوری که تفاوت داخلی داده‌ها به‌طور چشمگیری، کمتر از تفاوت‌های بین خوشه‌ای می‌شود (Andrienko et al., 2010). خوشه‌بندی از‌طرفی، یکی از اساسی‌ترین مسائل یادگیریِ ماشینۀ نظارت‌نشده و از طرف دیگر، روشی مفید در استخراج دانش از داده‌های مکانی است که هدف اصلی آن تفکیک داده‌ها در خوشه‌هایی با ویژگی‌های مشابه است (Jain, Murty, & Flynn, 1999). ساختار داده‌ها با خوشه‌بندی سازماندهی و تجزیه‌و‌تحلیل و اکتشاف داده‌ها تسهیل می‌شود.

داده‌های مکانی اغلب خود‌همبستگی مکانی (Spatial Autocorrelation) دارند که یک مفهوم اساسی در علوم مکانی است (Sui, 2004) و بدین معناست که پدیده‌های نزدیک شباهت‌های بیشتری نسبت به پدیده‌هایی دارند که از یکدیگر فاصله دارند (Tobler, 1970). خوشه‌بندی مکانی، سازماندهی اشیا مکانی در خوشه‌هاست؛ به‌گونه‌ای که اشیا داخل یک خوشه نه‌تنها از‌نظر ویژگی‌های اشیا، از‌نظر مکانی نیز به یکدیگر مشابه هستند و با اشیا داخل خوشه‌های دیگر تفاوت دارند (Miller, 2010). الگوریتم خوشه‌بندی داده‌های مکانی، دراساس با داده‌های غیرمکانی متفاوت است (Grubesic, Wei, & Murray, 2014). یک ویژگی اساسی داده‌های مکانی این است که مشاهده‌ها بیشتر وابسته به مکان است (Sui, 2004). اگر داده‌های مکانی با نادیده‌گرفتن وابستگی مکانی خوشه‌بندی شوند، ممکن است منجر به خوشه‌بندی نامناسب داده‌ها شوند (Openshaw, 1999). محققان به الگوریتم‌های خوشه‌بندی مکانی در طی سالیان توجه کرده‌اند؛ زیرا تعداد الگوریتم‌هایی که وابستگی مکانی را در روند داده‌ها لحاظ کرده‌اند، محدود است.

داده‌کاوی مکانی با به‌کارگیری شبکه‌های عصبی مصنوعی (ANN) (Artificial Neural Networks) و پایگاه داده‌های مکانی (Spatial Database)، الگوها و روابط ناشناخته در داده‌ها را کشف می‌کند تا اطلاعات را استخراج و در‌نهایت، آنها را به دانش جدید و بالقوه مفید تبدیل کند (Yuan et al., 2004). مفهوم ANN از زمان معرفی اولیه در دهۀ 1980 میلادی گسترش و تنوع زیادی یافته است؛ به‌طوری که امروزه به یکی از حوزه‌های بسیار فعّال پژوهشی تبدیل شده است. با افزایش حجم و ابعاد داده‌ها و نیاز به توان محاسباتی بالا و دقیق، شبکه‌های عصبی مصنوعی به ابزاری استاندارد برای حل مسائل خوشه‌بندی و طبقه‌بندی تبدیل شده‌اند.

یکی از انواع شبکه‌های عصبی مصنوعی، نقشۀ خود‌سازمانده (Self-Organizing Map) (SOM) است که کوهونن در آغاز دهۀ1980  میلادی پیشنهاد کرد Kohonen, 1995)). الگوریتم SOM می‌تواند برای خوشه‌بندی، بصری‌سازی و انتقال داده‌های چند‌بُعدی در فضایی با ابعاد کمتر استفاده شود (Stefanovic & Kurasova, 2018). نقشۀ خود‌سامانده (SOM) متداول‌ترین و رایج‌ترین الگوریتم برای خوشه‌بندی داده‌ها با ابعاد بالا و یا چند‌بُعدی است (Galutira, Fajardo, & Medina, 2019). الگوریتم SOM یک شبکۀ عصبی بدون نظارت است که داده‌های با ابعاد بالا یا چند‌بُعدی را در یک فضای تک‌بُعدی، دو‌بُعدی و در مواردی خاص سه‌بُعدی به نام نقشه نگاشت می‌کند (Wankhede, 2014). عنصر اصلی الگوریتم SOM رقابت انعطاف‌پذیر گره‌ها در لایۀ خروجی است که در هر تکرار، گره برنده نه‌تنها به‌روز می‌شود، همسایگان آن نیز تعدیل می‌شود. شبکۀ SOM می‌تواند به‌گونه‌ای تنظیم شود که داده‌های گروهی و کلاس‌های به‌نسبت مشابه با یکدیگر را شناسایی کند (Sheela & Deepa, 2012). باکائو، لوبو و پاینهو الگوریتم Geo-SOM را در سال 2005 معرفی کردند که انطباق‌یافتۀ الگوریتم SOM و مبتنی بر فرآیند یادگیری رقابتی است و جنبه مکانی دارد؛ زیرا جست‌وجو را به مجاورت جغرافیایی الگوهای ورودی محدود می‌کند (Bação, Lobo, & Painho, 2004; Hagenauer & Helbich, 2016). مهم‌ترین مزیت دو الگوریتم SOM و Geo-SOM در‌مقایسه با سایر روش‌های داده‌کاوی این است که این الگوریتم‌ها نه‌تنها نتیجه را به‌صورت برآوردهای عددی (بیشتر روش‌های داده‌کاوی) به ‌دست می‌آورند، نتیجه را به‌صورت بصری نیز ارائه می‌کنند (Stefanovic & Kurasova, 2011). بصری‌سازی به محققان اجازه می‌دهد تا خوشه‌ها و روابط بین داده‌ها را ببینند و نتایج خوشه‌بندی را تحلیل و تفسیر کنند (Zhang & Fang, 2012).

 

پیشینۀ پژوهش

پژوهش‌های متعدّدی در موضوعات مختلف برای خوشه‌بندی با استفاده از الگوریتم‌های SOM انجام شده است. Hagenauer & Helbich, 2016) (پژوهشی با عنوان « SPAWNNابزاری برای تحلیل فضایی با شبکه‌های عصبی خودسازمانده» انجام داده‌اند. محققان با به‌کارگیری الگوریتم‌های CNG (Contextual Neural Gas) و Geo-SOM داده‌های اجتماعی-اقتصادی بلوک‌های سرشماری سال 2010 میلادی را در ایالات متحده با متغیرهای قومیت، سن، مسکن و خانوار‌های شهر شیکاگو خوشه‌بندی کردند. نتایج پژوهش بینش‌های مهمی را دربارۀ ویژگی‌های اجتماعی-اقتصادی شهر شیکاگو نشان داد که  این شهر به‌دلیل تنوع اجتماعی-اقتصادی با تفکیک شدید قومیتی در سراسر مناطق شهری مواجه است.

لی و همکاران در پژوهشی با عنوان «استفاده از نقشۀ خودسازماندهی برای طبقه‌بندی کیفیت آب ساحلی: به‌سوی درک بهتر الگوها و فرآیندها» الگوریتم SOM را برای طبقه‌بندی کیفیت آب‌های ساحلی به کار بردند. در این پژوهش برای بررسی ویژگی‌های فضایی کیفیت آب در ناحیۀ ساحلی فوجیان، 19 متغیر کیفی آب در ۹۴ محل نمونه‌برداری‌شده بررسی شد. در این پژوهش برای نشان‌دادن الگوهای متغیرهای کیفیت آب از صفحات مؤلفۀSOM  (Component Planes) استفاده شد که در آن الگوهای مشابهی برای متغیرهایی که با یکدیگر در ارتباط بودند، مشاهده شد که نشان‌دهندۀ یک منبع مشترک بود. نتایج نشان داد که الگوریتم SOM یک ابزار مؤثر برای درک بهتر الگوها و فرآیندهای محرک کیفیت آب است  .(Li et al., 2018)

لیائو وهمکاران در پژوهشی با عنوان «کاوش پایگاه داده یک بررسی محیطی خاک با استفاده از یک نقشۀ جغرافیایی خود‌سازماندهی: یک مطالعۀ آزمایشی» الگوریتم SOM را برای خوشه‌بندی پایگاه ‌دادۀ زیست‌محیطی خاک به کار بردند. مجموعه داده‌ها با روش نمونه‌برداری منظم شبکه‌ایی از 5 فلز سنگین و نمونه‌های خاک نیز از 5 عنصر متنوع با چولگی بالا تشکیل شده بود. As و Pb الگوی توزیع سطحی و صفحات مؤلفۀ مشابهی داشتند که نشان‌دهنده همبستگی بالای این دو عنصر است؛ به این معنا که آنها در محیط خاک نیز رفتار مشابهی دارند .(Liao et al., 2019)

بررسی مطالعات پیشین نشان‌دهندۀ عملکرد مناسب شبکه‌های عصبی خودسازمانده در خوشه‌بندی داده‌هاست. در این مطالعات محققان با‌توجه به اهمیت داده‌کاوی و دانش به‌دست‌آمده از تحلیل داده‌ها و توانایی‌های الگوریتم‌های شبکه‌های عصبی در داده‌کاوی، جنبه‌های مختلف الگوریتم‌های شبکه‌های عصبی خودسازمانده را بررسی کرده‌اند.

کمیسیون جهانی محیط‌زیست و توسعه (World Commission on Environment and Development) (WCED) مفهوم توسعۀ پایدار را به‌عنوان توسعه‌ای که نیازهای نسل حاضر را بدون به خطر انداختن توانایی نسل‌های آینده برای برآوردن نیازهای خود مرتفع می‌کند، تعریف کرده است (Aldegheishem, 2014). پایداری شهری شامل ابعاد فیزیکی، اقتصادی و فرهنگی است (Rodrigues & Franco, 2020). هدف اصلی توسعۀ پایدار، تأمین نیازهای اساسی، بهبود و ارتقای سطح زندگی برای همه، حفظ و ادارۀ بهتر اکوسیستم‌ها و آینده‌ای امن‌تر و سعادتمند است. توسعۀ پایدار شهری فرآیندی است که طی آن گردش انرژی در شهر در شرایط حداقلی عملکردی، بیشترین کارایی را دارد و توزیع یکسانی را در به حرکت در آوردن عناصر به‌عنوان یک مجموعۀ یکپارچه و متصل ایجاد می‌کند (تقوایی و صفرآبادی، 1392). باوجود مزایای فراوان به‌کارگیری شبکۀ عصبی خود‌سازمانده در خوشه‌بندی داده‌های با ابعاد بالا و قدرت تفسیر‌پذیری آن، بررسی پیشینۀ پژوهش نشان می‌دهد که در پژوهش‌های داخلی به استفاده از الگوریتم‌های فوق در خوشه‌بندی داده‌های اجتماعی‌-اقتصادی مرتبط با توسعۀ پایدار شهری توجه نشده است؛ بنابراین در پژوهش حاضر سعی بر آن است که علاوه‌بر استفاده از شبکه‌های عصبی خود‌سازمانده برای خوشه‌بندی داده‌های اجتماعی-اقتصادی مرتبط با توسعۀ پایدار شهری، عملکرد دو الگوریتم SOM و Geo-SOM در خوشه‌بندی داده‌های فوق نیز مقایسه شود.

 

منطقۀ مطالعه‌شده

کلانشهر اصفهان سومین شهر پر‌جمعیت ایران با طول جغرافیایی 54 درجه و ۳۹ دقیقه و ۴۰ ثانیۀ شرقی و عرض جغرافیایی ۳5 درجه و ۳۸ دقیقه و ۳۰ ثانیۀ شمالی است. این کلانشهر 15 منطقۀ شهرداری دارد و بیشترین تراکم جمعیت آن به‌ترتیب متعلق به مناطق 8 و 10 است. این مناطق در سال‌های گذشته رشد فراوانی داشته که باعث افزایش تراکم آنها شده است. همچنین، در مناطق 1 و 2 که در‌واقع، بخش مرکزی شهر اصفهان را تشکیل می‌دهند، به‌علت قدمت بافت و تخریب فضای مسکونی، تراکم جمعیت آنها نسبت به متوسط تراکم کل مناطق بسیار کمتر شده است. شکل 1 مناطق پانزده‌گانۀ شهر اصفهان را به همراه بلوک‌های آماری و آمار جمعیتی آنها نمایش می‌دهد.

 

داده‌های پژوهش

داده‌های استفاده‌شده در پژوهش حاضر، داده‌های بلوک‌های آماری سرشماری جمعیت سال 1395 کلانشهر اصفهان است که مرکز آمار ایران ارائه کرده است. تعداد کل بلوک‌های آماری با جمعیت، برابر 13362 عدد است که متغیرهای متعدّد اجتماعی-اقتصادی دارد. در این متغیرها بلوک‌های آماری بر‌اساس ویژگی‌هایی چون جمعیت کل، سطح تحصیلات، فعالیت‌های اجتماعی-اقتصادی و ویژگی ساختمان‌ها توصیف می‌شود. همان‌طور که پیشتر نیز اشاره شد، هدف از پژوهش حاضر خوشه‌بندی بلوک‌های جمعیتی بر‌اساس متغیرهای اقتصادی-اجتماعی مرتبط با توسعۀ پایدار شهری است. بر‌اساس مرور پژوهش‌‌های صورت‌گرفته دربارۀ متغیرهای مرتبط با توسعۀ پایدار شهری، 10 متغیر برای خوشه‌بندی بلوک‌های آماری انتخاب شد که عبارت است از: تراکم جمعیت در فضا (سپهوند و عارف‌نژاد، 1392)، نسبت جمعیت متأهل (موسوی، 1397)، تعداد مهاجران وارد‌شده (احمدی، حسینی‌فر و نصیری هندخاله، 1395)، میزان اشتغال (توده فلاح و همکاران، 1397)، نسبت جمعیت جوان (Lez’er et al., 2019)، متوسط مساحت واحد مسکونی (نصیری دارانی، 1401)، تعداد واحد مسکونی آپارتمانی (محمدزاده، 1394)، میزان استحکام بنا (Patel & Patel, 2021)، نسبت باسوادی (برقی، 1397) و نسبت محصلان (نصیری دارانی، 1401).

بر این اساس، ستون‌های مرتبط با متغیرهای ده‌گانۀ فوق از داده‌های بلوک‌های آماری انتخاب و در‌صورت لزوم نسبت آنها به جمعیت کل برای هر بلوک جمعیتی محاسبه شده است. در‌نهایت، متغیرهای محاسبه‌شده برای هم‌مقیاس‌سازی و ورود به الگوریتم‌های لازم بر‌اساس میانگین و انحراف معیار استانداردسازی شد. در پژوهش حاضر علاوه‌بر متغیرهای فوق از مختصات جغرافیایی مراکز هندسی بلوک‌های آماری نیز به‌عنوان پارامتر مکانی استفاده شده است.

 

 

شکل 1: نقشۀ شهر اصفهان به تفکیک مناطق و بلوک‌های آماری (منبع: نویسندگان 1402)

Figure 1: Regions and Census Blocks of Isfahan City

 

روش‌شناسی پژوهش

در پژوهش حاضر از دو الگوریتم SOM و Geo-SOM برای خوشه‌بندی داده‌های اجتماعی-اقتصادی بلوک‌های آماری استفاده و نتایج حاصل با یکدیگر مقایسه شده است.

 

الگوریتم نقشه‌های خودسازمانده (SOM)

نقشۀ خودسازمانده یک شبکۀ پیشخور تک‌لایه است که در آن نورون‌های خروجی در یک ساختار توپولوژیکی با ابعاد کم مرتب شده است. با الگوریتم SOM داده‌های با ابعاد بالا به نقشه‌های ویژگی دو‌بُعدی شبکۀ نگاشت می‌شوند (شکل2). نقشه‌های خودسازمانده سعی می‌کند که در مرحلۀ نگاشت، روابط توپولوژیکی را حفظ کند؛ یعنی الگوهایی را که در فضای ورودی نزدیک به یکدیگر هستند به واحدهایی که در فضای خروجی نزدیک هستند، نگاشت می‌کند و برعکس. برای نگاشت به هر نورون یک بردار وزنی برابر با ابعاد فضای ورودی وجود دارد؛ یعنی هر واحد i یک بردار وزنی متناظر با بُعد d wi={wi1, wi2,…..,wid} دارد. ابعاد فضای ورودی به‌طور معمول، از ابعاد شبکۀ خروجی بیشتر است. بیشتر الگوریتم‌های SOM در یک شبکۀ مستطیلی از واحدها پیاده‌سازی می‌شوند. ایدۀ اصلی این است که در‌طول آموزش، هر داده با تمام واحدها مقایسه و شبیه‌ترین آنها که به‌عنوان بهترین واحد تطبیق (Best Matching Unit) (BMU) شناخته می‌شود، انتخاب شود. سپس BMU و همسایگان آن در شبکه به‌روزرسانی شوند تا به آن دادۀ خاص نزدیک‌تر شوند. در‌حین نگاشت تنها یک نورون برنده وجود خواهد داشت و آن نورونی است که بردار وزنی آن نزدیک‌ترین فاصله را با بردار ورودی داشته باشد که با محاسبۀ فاصلۀ اقلیدسی بین بردار ورودی و بردار وزنی تعیین می‌شود.

روند اصلی آموزش شبکه‌های عصبی خود‌سازمانده به‌صورت زیر است (Kohonen, 1995).

  1. در وزن‌های اولیۀ مقدار‌دهی شده بیشترین مقدار برای شعاع تابع همسایگی R و میزان یادگیری α تعیین و تا زمانی که شرایط توقف برقرار نیست، مراحل 2 تا 8 انجام می‌شود؛
  2. فاصلۀ اقلیدسی برای هر نورون j محاسبه می‌شود؛

رابطۀ (1)                             

    ام جزء بردار ورودی  است و  پیوند وزنی  در نورون واقع در ( ) است.

  1. نزدیک‌‌ترین نورون به‌عنوان نورون برنده انتخاب می‌شود؛

رابطۀ (2)                                               

فاصلۀ اقلیدسی نورون کمترین مقدار باشد.

  1. هر نرونj با‌توجه به همسایگی آن با نورون  به‌روز‌رسانی می‌شود؛

رابطۀ (3)                      

  1. میزان یادگیری به‌روز‌رسانی می‌شود؛
  2. شعاع عملکرد تابع همسایگی توپولوژیک کاهش پیدا می‌کند؛
  3. بررسی شرایط توقف تا زمانی تکرار می‌شود که معیار توقف به دست آید. به‌طور معمول، معیار توقف، تعداد ثابتی از تکرار را دارد.

برای هم‌گرایی و ثبات نقشه، میزان یادگیری و شعاع همسایگی در هر تکرار کاهش می‌یابد؛ بنابراین هم‌گرایی به سمت صفر میل خواهد کرد.

 

شکل 2: دیاگرام الگوریتم SOM (منبع: نویسندگان 1402)

Figure 2: Diagram of Self-Organizing Map Algorithm

 

الگوریتم Geo-SOM

الگوریتم Geo-SOM توزیع واحدهای SOM را نه‌تنها با‌توجه به شباهت بین همسایگان، با‌توجه به تراکم جغرافیایی بردارهای ورودی نیز ایجاد می‌کند (Bação et al., 2004). در الگوریتم آموزشی SOM، مهم‌ترین مرحله در تعیین اینکه کدام الگوها با یکدیگر خوشه‌بندی شوند، مرحلۀ‌ انتخاب بهترین واحد تطبیق (BMU) است؛ بنابراین با تغییر نحوۀ انتخاب BMU می‌توان به مختصات جغرافیایی اهمیت بیشتری داد. در الگوریتم Geo-SOM برای قرار‌دادن BMU در مجاورت جغرافیایی الگوی ورودی، فرآیند جست‌وجوی انتخاب بهترین واحد تطبیق (BMU) در دو مرحله انجام می‌شود. در مرحلۀ اول، همسایگی جغرافیایی که امکان جست‌وجو برای BMU در آن وجود دارد، انتخاب و در مرحلۀ دوم با استفاده از سایر متغیرها جست‌وجوی نهایی انجام می‌شود. این همسایگی جغرافیایی با پارامتر k (حد آستانۀ جغرافیایی: Geographic Tolerance) که در فضای خروجی نقشۀ SOM تعریف شده است، کنترل می‌شود (شکل 3). در حالت ، الگوریتم نزدیک‌ترین واحد را از‌لحاظ جغرافیایی به‌عنوان BMU انتخاب می‌کند. با تنظیم k برابر با اندازۀ نقشۀ SOM، مختصات جغرافیایی نادیده گرفته می‌شود. وقتی  است مکان‌های نهایی بردارها در فضای ورودی به‌طور تقریبی، متناسب با مکان‌های جغرافیایی بردارهای آموزشی خواهد بود (Bação et al., 2004).

 

 

شکل 3: دیاگرام الگوریتم Geo-SOM (منبع: نویسندگان 1402)

Figure 3: Diagram of Geo-SOM Algorithm

 

ابزارهای بصری‌سازی در الگوریتم SOM و Geo-SOM

برای تجزیه‌و‌تحلیل خروجی الگوریتم‌های SOM و Geo-SOM از ابزارهای بصری‌سازی (Visualization) متعدّدی استفاده می‌شود که عبارت است از:

 

ماتریسU (U- Matrix)

یک راه به‌نسبت ساده برای شناسایی خوشه‌های SOM و Geo-SOM استفاده از ماتریس U (ماتریس فاصلۀ یکپارچه) (Unified Distance Matrix) است. توپولوژی پیش‌فرض نقشه‌های خود‌سازمانده، شش‌ضلعی است. این شش‌ضلعی‌ها، مکان نورون‌ها و روابط همسایگی آنها را با نورون‌های دیگر در توپولوژی شبکه نشان می‌دهد که ماتریس U نامیده می‌شود. فاصلۀ بین گره‌های همسایه در ماتریس U با‌توجه به فاصلۀ اقلیدسی وزن‌‌دار می‌شوند و با رنگ روی نقشه ترسیم می‌شوند (Löhr et al., 2010). رنگ‌های سردتر (آبی) نورن‌های همسایه را که نزدیک هستند (شباهت دارند) نشان می‌دهد و رنگ‌های داغ‌تر (قرمز) نورن‌های همسایه را که فاصلۀ زیاد دارند (متفاوت هستند)، نشان می‌دهد. سرانجام، می‌توان گفت در ماتریس U گره‌های با فاصلۀ کم به یک خوشه تعلق دارند و گره‌های با فاصلۀ زیاد مرزهای خوشه‌های مختلف را نشان می‌دهند (Park et al., 2018). بنابراین با استفاده از ماتریس U می‌توان نتایج خوشه‌بندی شبکه را تحلیل و ارزیابی کرد.

 

صفحات مؤلفه‌ها (Component Planes)

صفحۀ مؤلفه، وزن نسبی هر‌یک از مؤلفه‌های (متغیرهای) بردارهای ورودی را به‌طور جداگانه، نشان می‌دهد (Kohonen, 1995). تعداد صفحات مؤلفه‌ها در هر الگوریتم SOM وGeo-SOM  برابر با اندازۀ ابعاد دادۀ ورودی است؛ بنابراین برای هر متغیر از بردار ورودی یک صفحۀ مؤلفه وجود دارد (در این پژوهش 10 صفحه برای الگوریتم SOM و 12 صفحه برای الگوریتم  Geo-SOMایجاد می‌شود). وزن‌های هر‌یک از بردارهای ورودی را می‌توان با استفاده از صفحۀ مؤلفه بصری‌سازی کرد. در این صفحات، رنگ‌های روشن‌تر و تیره‌تر به‌ترتیب نشان‌دهندۀ وزن‌های بزرگ‌تر (نگاشت‌شدن متغیرهایی با مقدار‌های بیشتر) و کوچک‌تر (نگاشت‌شدن متغیرهایی با مقدار‌های کمتر) است. با مقایسۀ صفحات مؤلفه می‌توان الگوهای اتصال و ارتباط مؤلفه‌ها را با یکدیگر بررسی کرد. اگر صفحات مؤلفه‌ها با یکدیگر مشابه باشد، بردارهای ورودی همبستگی بالایی دارند و برعکس. صفحات مؤلفه را می‌توان بر‌اساس شاخص شباهت آنها مقایسه و متغیرهای مشابه و با همبستگی و غیرمشابهِ بدون همبستگی را از یکدیگر جدا کرد (Löhr et al., 2010).

 

Hits Map

Hits Maps نقشۀ مفید دیگری است که نشان می‌دهد یک نورون شبکه به‌عنوان BMU چند بار انتخاب شده است و یا به عبارت دیگر، چند دادۀ ورودی به هر نورون نگاشت شده است. همچنین، با این نقشه می‌توان توزیع بردارهای ورودی را در‌سطح نورون‌های شبکه بررسی کرد که بهتر است داده‌ها به‌طور یکنواخت، در سراسر نورون‌های شبکه توزیع شده باشد (Kassambara, 2017).

 

نقشۀ خوشه‌ها (Clusters Map)

در الگوریتم SOM به‌طور معمول، تعداد نورون‌ها بسیار بیشتر از تعداد خوشه‌های واقعی است. در این الگوریتم تعداد تقریبی خوشه‌ها را می‌توان با استفاده از ماتریس U و بر‌اساس فاصله‌های میان نرون‌ها تعریف کرد. گفتنی است در اینجا منظور از نقشۀ خوشه‌ها نقشه‌ای مبتنی بر ماتریس U است که در آن شمارۀ خوشه برای هر نورون تعیین شده باشد. بر‌اساس این نقشه می‌توان نقشۀ جغرافیایی بلوک‌های آماری را تولید کرد که در آن برای هر بلوک، شمارۀ خوشۀ مربوط به آن مشخص شده باشد.

 

اندازۀ نقشه

اندازۀ نقشه (تعداد نورون‌های خروجی) برای اجرای SOM حیاتی است؛ با این حال هیچ قانون دقیقی برای تعیین اندازۀ نقشه وجود ندارد. الهونیمی و وسانتو در سال 2000 میلادی روشی پیشنهاد کردند که تعداد بهینۀ نورون‌ها نزدیک به  است (n تعداد نمونه‌های مطالعه‌شده است). اگر این فرض صحیح باشد، اندازۀ بهینۀ نقشه در مطالعۀ حاضر باید برابر با 578 نورن باشد که عدد بزرگی است. آزمون‌های متعدّد در پژوهش حاضر نشان داد اگر اندازه نقشۀ خیلی کوچک باشد، خوشه‌ها تفکیک‌ناپذیر می‌شوند یا اگر خیلی بزرگ باشد، نه‌تنها خوشه‌ها تفکیک‌پذیر نخواهند بود، در بعضی از نورون‌ها نیز بردار ورودی نگاشت نمی‌شود؛ بنابراین اگر اندازۀ نقشه با‌توجه به ابعاد داده‌ها و تعداد متغیرهای مطالعه‌شده پس از بررسی اندازه‌های مختلف انتخاب شود، تفکیک خوشه‌ها دقیق‌تر و به‌تبع آن در همۀ نورون‌ها بردار ورودی نگاشت خواهند شد. در پژوهش حاضر پس از بررسی اندازه‌های مختلف، نقشه‌ای به‌ اندازۀ 49 نورون یا شبکه (7*7) انتخاب شد .(Vesanto & Alhoniemi, 2000)

ارزیابی نتایج خوشه‌بندی

در پژوهش حاضر برای ارزیابی نتایج خوشه‌بندی از ضریب سیلهوته (Silhouette) استفاده شد. این ضریب برای یک خوشه، درجۀ شباهت داده‌های داخل یک خوشه و شباهت‌نداشتن با خوشه‌های دیگر را اندازه‌گیری می‌کند (Kaufman & Rousseeuw, 2009). این ضریب برای هر نمونه، هر کلاس و مجموعه کل داده‌ها محاسبه می‌شود. ضریب سیلهوته بر‌اساس دوری و نزدیکی نمونه‌ها و خوشه‌ها به یکدیگر و با استفاده از رابطۀ 4 قابل محاسبه است.

رابطۀ (4)

 

در این رابطه   مقدار ضریب سیلهوته محاسبه‌شده برای نمونۀ  است. در این رابطه  میانگین عدم تشابه (Dissimilarity) بین مشاهدۀ  با سایر مشاهد‌ه‌ها در یک خوشۀ مشابه و  کمینۀ میانگین عدم تشابه مشاهدۀ  نسبت به تمام مشاهده‌ها در خوشه‌های دیگر است. بر‌اساس رابطۀ فوق مقدار بین 1- و 1+ قرار دارد. اگر  به 1+ نزدیک‌تر باشد، به این معناست که خوشۀ پیشنهاد‌شده برای نمونۀ لازم مناسب و چنانچه  به 1- نزدیک‌تر باشد، به این معناست که خوشۀ پیشنهاد‌شده برای نمونۀ لازم نامناسب است.

کیفیت کلی خوشه‌بندی را می‌توان با استفاده از میانگین ضریب سیلهوته برای کل مجموعه داده اندازه‌گیری کرد که بر‌اساس رابطۀ 5 تعریف می‌شود.

رابطۀ (5)

 

در این رابطه  تعداد کل نمونه‌هاست و مقدار بالاتر  نشان‌دهندۀ خوشه‌بندی مناسب است (Hsu & Li, 2010).

 

یافتههای پژوهش و تجزیهوتحلیل

ماتریس U

شش‌ضلعی‌های حاوی اعداد در این ماتریس نشان‌‌دهندۀ مراکز نورون‌های شبکه است. همچنین، این اعداد نشان می‌دهد که نورون‌های برنده‌شده متعلق به کدام خوشه است. همان‌طور که اشاره شد، توپولوژی شبکه در این مطالعه، پس از بررسی اندازه‌های متعدّد ماتریس U برای شناسایی خوشه‌ها، 7 در 7 انتخاب شده است؛ بنابراین 49 نورون در شبکه وجود دارد. همان‌طور که اشاره شد، فاصلۀ بین نورن‌های متعلق به یک خوشه کمتر از فاصلۀ بین نورن‌های متعلق به خوشه‌های دیگر است. باتوجه به آنچه در شکل 4 آمده است، فاصلۀ بین نورن‌های متعلق به خوشۀ 4، در ماتریس U الگوریتم SOM با شش‌ضلعی‌های آبی پر‌رنگ و فاصلۀ این نورن‌ها با نورن‌های خوشه‌های دیگر با شش‌ضلعی‌های روشن‌تر زرد یا قرمز مشخص شده است. همچنین، فاصلۀ نورن‌های متعلق به خوشۀ 10، نسبت به یکدیگر با شش‌ضلعی‌های آبی رنگ و با نورن‌های متعلق به خوشه‌های 2 و 5 با شش‌ضلعی زرد و نارنجی رنگ مشخص شده است.

تحلیل و بررسی این ماتریس‌ها نشان می‌دهد که نتایج حاصل از دو الگوریتم SOM و SOM-Geo به‌طور کامل، متفاوت است. در ماتریس U الگوریتم SOM بیشتر نورون‌های شبکه (23 نورون) در خوشۀ 4 و تعداد 7 نورون در خوشۀ 2 و سایر نورون‌های شبکه در خوشه‌های دیگر دسته‌بندی شده‌ است. در ماتریس U الگوریتم SOM-Geo به‌جزء خوشه‌های 1، 7، 9 و 10 که به هر‌کدام یک نورون تعلق دارد، 45 نورون دیگر شبکه در 7 خوشۀ دیگر دسته‌بندی شده‌ است. تفاوت اصلی این دو الگوریتم در نحوۀ نگاشت بردارهای ورودی در نورون‌های شبکه است که این تفاوت نیز منجر به دسته‌بندی متفاوت نورون‌های شبکه در خوشه‌های هر دو الگوریتم می‌شود؛ برای مثال، بردارهای ورودی نگاشت‌شده در قسمت بالا و سمت چپ نورون‌های شبکۀ SOM باید ویژگی‌های به‌طور تقریبی، مشابهی داشته باشند تا در خوشۀ 4 دسته‌بندی شوند؛ در‌حالی که در همین بخش از نورون‌های شبکۀ SOM-Geo، بردارهایی نگاشت شده‌اند که از‌طرفی، ویژگی‌های متفاوت دارند و از طرف دیگر، در چندین خوشۀ متفاوت دسته‌بندی شده‌اند. این تفاوت الگوریتم‌ها در نگاشت بردارهای ورودی به نورون‌‌های شبکه به‌دلیل وزن نسبی متفاوت هر‌یک از متغیرها در بردارهای ورودی الگوریتم‌هاست.

 

شکل 4: ماتریس U و شمارۀ خوشه‌های الگوریتم‌های SOM و Geo-SOM (منبع: نویسندگان 1402)

Figure 4: U-Mat Cluster Number of SOM and Geo-SOM Algorithms

 

صفحات مؤلفه‌ها

الگوریتم نقشه‌های خودسازمانده، صفحۀ مؤلفۀ همۀ بردارهای ورودی را به‌طور جداگانه، ترسیم می‌کند. این صفحات نشان‌دهندۀ وزنی است که بردار ورودی را به نورون شبکه نگاشت می‌کند. وزن هریک از بردارهای ورودی بین 0 تا 1 محاسبه شده است. با صفحات مؤلفه می‌توان وزن نسبی هریک از مؤلفه‌ها را در نگاشت‌شدن به نورون‌های شبکه برآورد و با وزن نسبی مؤلفه‌های دیگر مقایسه و همبستگی موجود بین بردارهای ورودی و نحوۀ نگاشت‌شدن آنها را نیز تحلیل و بررسی کرد. صفحات عناصر بردار‌های ورودی هر دو الگوریتم نشان می‌دهد که وزن نسبی هریک از متغیرها در نگاشت‌شدن به نورن‌های شبکه به‌طور کامل، متفاوت است؛ برای مثال، متغیر نسبت جمعیت متأهل، وزن نسبی متفاوتی را در نگاشت‌شدن به شبکه در الگوریتم‌های SOM و Geo-SOM دارد. در الگوریتم SOM مقدار‌های بیشتر این متغیر ورودی تمایل به نگاشت‌شدن در نورون‌های بالا سمت چپ شبکه را دارد (نورورن‌های قرمز رنگ)؛ زیرا منطبق بر خوشۀ شمارۀ 4 است و مقدار‌های کمتر این متغیر تمایل به نگاشت‌شدن در نورون‌های پایین سمت چپ شبکه را دارد؛ زیرا انطباق زیادی با خوشۀ شمارۀ 1 دارد (شکل 5). در الگوریتم Geo-SOM، مقدار‌های بالاتر این متغیر در نورون‌های سمت چپ شبکه و مقدار‌های پایین‌تر آن در نورن‌های پایین سمت چپ شبکه نگاشته شده است؛ زیرا مقدار‌های بالاتر بر خوشه‌های شمارۀ 8 و 9 و مقدار‌های پایین‌تر بر خوشه‌های شمارۀ 2 و 10 منطبق است (شکل 6). همچنین، در الگوریتم SOM مقدار‌های زیاد متغیر نسبت باسوادی تمایل به نگاشت‌شدن در نورون‌های سمت راست شبکه را دارد که انتظار می‌رود در خوشه‌های شمارۀ 4، 5 و 10 دسته‌بندی شود. در‌صورتی که مقدار‌های پایین این متغیر تمایل به نگاشت‌شدن در نورون‌های سمت چپ شبکۀ منطبق بر خوشه‌های شمارۀ 1 و 8 را دارد. در الگوریتم Geo-SOM مقدار‌های بالای متغیر میزان باسوادی تمایل به نگاشت‌شدن در نورون‌های بالا سمت راست شبکۀ منطبق بر خوشه‌های شمارۀ 7، 6 و یا 5 را دارد. در‌صورتی که مقدار‌های پایین این متغیر تمایل به نگاشت‌شدن در نورون‌های پایین سمت چپ شبکۀ منطبق بر خوشه‌های شمارۀ 10 و 2 را دارد که نتایج حاصل در جدول‌های 1 و 2 بیانگر صحت عملکرد این الگوریتم‌ها با این متغیرهاست. همچنین، مقایسۀ صفحات مؤلفۀ بردارهای ورودی نشان می‌دهد که نحوۀ نگاشت‌شدن و وزن نسبی مؤلفه‌ها در هر الگویتم به‌طور کامل، متفاوت است؛ در‌حالی که صفحۀ مؤلفۀ هر‌یک از متغیرهای ورودی شبیه به یکدیگر نیست؛ بنابراین نحوۀ نگاشت‌شدن این متغیرها به نورون‌های شبکه متفاوت است و این متغیرها با یکدیگر همبستگی ندارند.

 

شکل 5: صفحات مؤلفه‌های الگوریتم SOM (منبع: نویسندگان 1402)

Figure 5: Component Planes of SOM Algorithm

 

شکل 6: صفحات مؤلفه‌های الگوریتم Geo-SOM (منبع: نویسندگان 1402)

Figure 6: Component Planes of Geo-SOM Algorithm

 

Hits Maps

الگوریتم نقشه‌های خودسازمانده، نقشۀ Hits Maps را پس از اتمام نگاشت بردارهای ورودی ترسیم می‌کند و تعداد نسبی برنده‌شدن نورون‌های شبکه را نشان می‌دهد. هر‌چه اندازۀ شش‌ضلعی‌ها بزرگ‌تر باشد، نشان‌دهندۀ این است که این نورون، دفعات بیشتری برنده شده و تعداد بیشتری بردار ورودی در آن نورون نگاشت شده است و برعکس. تحلیل و بررسی Hits map الگوریتم‌های  SOMو Geo-SOM نشان می‌دهد که توزیع بردارهای ورودی در نورون‌ها برای این دو الگوریتم به‌طور کامل، متفاوت است (شکل5). در الگوریتم SOM دو نورون شبکه بیشتر از بقیه نورون‌ها برنده شده‌ است؛ بنابراین تعداد بردارهای ورودی بیشتری در این دو نورون نگاشت شده است؛ بدین معنا که تنها چند نورون شبکه، بیشترین شانس برنده‌شدن را داشتند و بقیۀ نورن‌های شبکه شانس کمتری داشتند. به همین خاطر، بردارهای ورودی کمتری نیز در آنها نگاشت شده است. این در‌حالی است که بردارهای ورودی الگوریتم Geo-SOM به‌طور تقریبی، در نورون‌های بیشتری نگاشت شده است؛ به‌‌طوری که بیشتر نورن‌های شبکه در‌مقایسه با الگوریتم SOM شانس بیشتری برای برنده‌شدن دارند و تعداد بیشتری بردار ورودی نیز در آنها نگاشت شده است. تأثیر متغیرهای ورودی در برنده‌شدن نورون‌ها و نگاشت‌شدن بردارهای ورودی در این نورون‌ها نشان می‌دهد که در‌نظر‌گرفتن بُعد مکانی، تأثیری مثبت در روند نگاشت بردارهای ورودی در نورون‌های برنده داشته است.

 

شکل 7: Hits Map الگوریتم‌های SOM و Geo-SOM (منبع: نویسندگان 1402)

Figure 7: Hits Map of SOM and Geo-SOM Algorithms

 

نقشۀ بلوک‌های آماری خوشه‌بندی‌شده

شکل‌های 8 و 9 نشان‌دهندۀ بلوک‌های آماری خوشه‌بندی‌شدۀ کلانشهر اصفهان با استفاده از دو الگوریتم SOM و Geo-SOM است. همان‌طور که مشاهده می‌شود نتایج حاصل از خوشه‌بندی هر دو الگوریتم به‌طور کامل، متفاوت است. الگوریتم SOM داده‌های بلوک آماری را در خوشه‌هایی در‌هم‌تنیده، ناهمگن و پراکنده خوشه‌بندی کرده است (شکل 8). متغیرهای مطالعه‌شده (داده‌های بلوک آماری) وابسته به مکان هستند؛ بنابراین بلوک‌هایی که از‌لحاظ مکانی نزدیک به یکدیگر هستند، تمایل به ویژگی‌های مشابه دارند. پس اگر چنین داده‌هایی خوشه‌بندی شوند و ویژگی‌های مکانی آنها لحاظ نشده باشد، ممکن است به خوشه‌بندی نامناسب منجر شوند که به‌طور کامل، در نتایج خوشه‌بندی این الگوریتم‌ها مشهود است. الگوریتم Geo-SOM با به‌کارگیری ویژگی‌های مکانی و استفاده از معیار شباهت داده‌های بلوک آماری در روند آموزش الگوریتم، داده‌های بلوک آماری را در خوشه‌هایی متجانس و همگن دسته‌بندی کرده است (شکل 9). همان‌طور که انتظار می‌رفت، هر خوشه در یک محدودۀ جغرافیایی توزیع شده است. از آنجایی که روند خوشه‌بندی و متغیرهای بردارهای ورودی هر دو الگوریتم یکسان و تنها تفاوت این دو الگوریتم به‌کار‌گیری مکانی در روند خوشه‌بندی الگوریتم Geo-SOM است، تحلیل ماتریس‌های U، صفحات مؤلفه‌ها و Hits Map هر دو الگوریتم نشان داد که تأثیر پارامترهای مکانی بر نتایج خوشه‌بندی داده‌های بلوک آماری درخور توجه است.

 

 

شکل 8: نقشۀ بلوک‌های آماری خوشه‌بندی‌شدۀ شهر اصفهان حاصل از الگوریتم SOM (منبع: نویسندگان 1402)

Figure 8: Map of Clustered Census Blocks of Isfahan City Produced by SOM Algorithm

 

 

شکل 9: نقشۀ بلوک‌های آماری خوشه‌بندی‌شدۀ شهر اصفهان حاصل از الگوریتم Geo-SOM (منبع: نویسندگان 1402)

Figure 9: Map of Clustered Census Blocks of Isfahan City Produced by Geo-SOM Algorithm

در الگوریتم‌های SOM و Geo-SOM 13362 بلوک آماری در 10 خوشه طبق جدول‌های 1 و 2 خوشه‌بندی شده است. در جدول1 که مربوط به نتایج حاصل از الگوریتم SOM است، خوشۀ 4 با 66/44 درصد از کل بلوک‌ها بیشترین تعداد و خوشۀ 9 با 9/1 درصد کمترین تعداد بلوک را دارد که در ماتریس U الگوریتم SOM نیز مشاهده می‌شود که 23 نورون از 49 نورون در خوشۀ 4 و تنها 1 نورون در خوشۀ 9 دسته‌بندی شده است. در نتایج مربوط به الگوریتمGeo-SOM  (جدول 2) خوشۀ 3 با 4508 بلوک آماری خوشه‌بندی‌شده و با 73/33 درصد کل بلوک‌ها بیشترین تعداد و خوشۀ 1 با 36/1 درصد کمترین تعداد بلوک را دارد که در ماتریس U الگوریتم Geo-SOM نیز مشهود است که 17 نورون از 49 نورون در خوشۀ 3 و تنها 1 نورون در خوشۀ 1 دسته‌بندی شده است. با‌توجه به نتایج الگوریتمGeo-SOM  که در آن بلوک‌های دسته‌بندی‌شده در یک محدودۀ جغرافیایی خاص محدود شده‌اند، می‌توان ویژگی‌های هر خوشه را به‌صورت «منطقه‌ای» تحلیل کرد؛ برای مثال، در خوشۀ 5 واقع در مرکز و جنوب شهر اصفهان، میانگین مساحت واحد مسکونی برابر با 7/129 متر متربع است که نسبت به میانگین کل شهر که برابر با 6/115 متر مربع است، بالاتر است که این خود نشان‌دهندۀ بالاتر‌بودن این شاخص از‌منظر توسعۀ پایدار شهری در این منطقه است. همچنین، خوشۀ 10 با میانگین 9/87 متر مربع واقع در شمال شرقی شهر، واحدهای مسکونی کوچک‌تری نسبت به میانگین کل شهر دارد. میانگین میزان باسوادی در کلانشهر اصفهان 91 درصد است؛ در‌حالی که خوشۀ 7 با میانگین 98 درصد واقع در جنوبی‌ترین منطقۀ شهر، درصد باسوادی بیشتری را نسبت به میانگین کل شهر و خوشۀ 6 با میانگین 50 درصد واقع در جنوب شرقی شهر، میزان باسوادی کمتری نسبت به میانگین کل شهر دارد که از‌منظر توسعۀ پایدار شهری نشان‌دهندۀ بالاتر‌بودن این شاخص در خوشۀ 7 و و پایین‌تر‌بودن آن در خوشۀ 6 از میانگین کل شهر است. به‌طور کلی با‌توجه به پراکنش خوشه‌ها در یک منطقۀ خاص و بررسی میانگین متغیرهای هر خوشه می‌توان به نتایج مهمی دست یافت؛ برای مثال، خوشۀ 9 واقع در مناطق جنوبی شهر تراکم جمعیت کمتر، نسبت جمعیت متأهل بیشتر، میزان اشتغال بالاتر، نسبت جمعیت جوان متوسط، مساحت مسکونی بالاتر، تعداد مهاجران کمتر و نسبت باسوادی بالاتری از میانگین کل شهر دارد که نشان می‌دهد مناطق جنوبی از‌لحاظ شاخص‌های توسعۀ پایدار و کیفیت زندگی در وضعیت مناسبی قرار دارد. همچنین، خوشۀ 4 واقع در مناطق شمالی شهر به‌دلیل داشتن تراکم جمعیت بیشتر، نسبت جمعیت متأهل متوسط، میزان اشتغال متوسط، نسبت جمعیت جوان بالاتر، مساحت مسکونی کمتر، تعداد مهاجران بیشتر و نسبت باسوادی کمتر نسبت به مناطق جنوبی از‌لحاظ شاخص‌های توسعۀ پایدار در‌سطح پایین‌تری قرار دارد.

از آنجایی که توسعۀ پایدار شهری روندی در راستای بهبود شرایط فیزیکی، اقتصادی، اجتماعی، فرهنگی است، مدیریت این روند نیازمند شناسایی وضعیت موجود براساس معیارهای مرتبط است. شناسایی مناطق همگن در‌قالب خوشه‌های مجزا با خصوصیات معین، خود عاملی مؤثر و تسهیل‌کننده برای برنامه‌ریزی‌های محیطیِ متمرکز کوتاه‌مدت و بلند‌مدت است؛ در‌نتیجه به‌کارگیری الگوریتم‌های خوشه‌بندی مبتنی بر مکان (Geo)، خوشه‌بندی مناطق شهری را فراهم می‌کند که مبتنی بر شاخص‌های توسعۀ پایدار و استخراج مناطق همگن برای تسهیل در مدیریت و برنامه‌ریزی شهری است.

 

جدول 1: میانگین متغیرهای اجتماعی-اقتصادی در خوشه‌های حاصل از الگوریتم SOM

Table 1: The Average of Socio-Economic Variables in the Clusters Produced by SOM Algorithm

خوشه‌های SOM

تراکم جمعیت در فضا

نسبت جمعیت متأهل

میزان اشتغال

نسبت جمعیت جوان

مساحت واحد مسکونی

تعداد واحد مسکونی آپارتمانی

مهاجران وارد‌شده

میزان استحکام بنا

نسبت باسوادی

نسبت محصلان

تعداد بلوک‌های هر خوشه

درصد بلوک‌های هر خوشه

1

04/0

49/0

50/0

24/0

89

29

02/0

5/12

81/0

20/0

1816

5/13

2

03/0

53/0

45/0

25/0

8/98

27

10/0

28/22

94/0

25/0

1797

4/13

3

03/0

56/0

43/0

24/0

101

9/23

04/0

74/22

94/0

25/0

359

68/2

4

02/0

58/0

46/0

21/0

7/131

6/16

02/0

2/19

96/0

21/0

6236

6/46

5

02/0

56/0

44/0

22/0

121

5/52

03/0

5/61

97/0

23/0

379

9/2

6

03/0

58/0

47/0

22/0

5/102

8/19

02/0

1/18

92/0

19/0

196

1.46

7

03/0

54/0

47/0

20/0

6/99

5/23

01/0

18

88/0

19/0

490

3.66

8

02/0

56/0

50/0

20/0

8/105

6/15

01/0

5/12

83/0

16/0

580

34/4

9

03/0

53/0

44/0

23/0

94

27

01/0

6/18

92/0

22/0

256

9/1

10

02/0

56/0

46/0

22/0

9/117

6/126

04/0

4/133

94/0

23/0

1253

37/9

میانگین کل

02/0

55/0

46/0

22/0

6/115

7/31

03/0

3/30

91/0

22/0

13362

100

منبع: نویسندگان 1402

 

جدول 2: میانگین متغیرهای اجتماعی-اقتصادی در خوشه‌های حاصل از الگوریتم Geo-SOM

Table 2: The Average of Socio-Economic Variables in the Clusters Produced by Geo-SOM Algorithm

خوشههای Geo-SOM

 

تراکم جمعیت در فضا

نسبت جمعیت متأهل

میزان اشتغال

نسبت جمعیت جوان

مساحت واحد مسکونی

تعداد واحد مسکونی آپارتمانی

مهاجران وارد‌شده

میزان استحکام بنا

نسبت باسوادی

نسبت محصلان

تعداد بلوک‌های هر خوشه

درصد بلوک‌های هر خوشه

1

04/0

56/0

47/0

27/0

5/115

4/42

05/0

56

93/0

21/0

183

36/1

2

03/0

54/0

47/0

23/0

93

3/46

03/0

3/19

82/0

21/0

533

98/3

3

03/0

56/0

47/0

26/0

5/111

4/30

03/0

2/26

89/0

21/0

4508

73/32

4

04/0

56/0

45/0

29/0

8/94

7/50

05/0

32

90/0

23/0

1116

35/8

5

02/0

55/0

46/0

20/0

7/129

34

03/0

9/41

94/0

22/0

3153

59/23

6

02/0

55/0

44/0

22/0

7/116

3/44

06/0

5/43

95/0

23/0

809

05/6

7

02/0

55/0

41/0

24/0

8/124

2/20

06/0

4/25

98/0

26/0

679

05/5

8

02/0

57/0

47/0

23/0

7/112

10

02/0

1/10

89/0

21/0

986

37/7

9

02/0

58/0

49/0

23/0

2/121

6/51

02/0

3/42

93/0

20/0

768

5.74

10

04/0

52/0

49/0

026/0

9/87

7/47

03/0

1/13

84/0

21/0

630

4.71

میانگین کل

02/0

55/0

46/0

22/0

56/11

7/31

03/0

3/30

91/0

22/0

13362

100

منبع: نویسندگان 1402

 

ارزیابی نتایج خوشه‌بندی SOM و Geo-SOM با مقایسۀ ضرایب سیلهوته بیانگر این است که در نتایج الگوریتم SOM بیشتر بلوک‌های آماری خوشه‌بندی‌شده، ضرایب سیلهوته منفی و تعداد کمی ضریب سیلهوته مثبت دارند. این در‌حالی است که ضرایب سیلهوته بلوک‌های آماری خوشه‌بندی‌شدۀ الگوریتم Geo-SOM مثبت بوده است و تعداد کمی ضرایب سیلهوته منفی داشتند. کیفیت کلی نتایج خوشه‌بندی با استفاده از میانگین ضریب سیلهوته برای کل مجموعه داده بدین صورت است که الگوریتم Geo-SOM با میانگین ضریب سیلهوته 27/0 نسبت به الگوریتم SOM با میانگین ضریب سیلهوته 02/0- کیفیت خوشه‌بندی بالا‌تری دارد. این نتایج بیانگر تأثیر مثبت پارامترهای مکانی در روند خوشه‌بندی است.

 

نتیجه‌گیری

شبکه‌های عصبی خود‌سازمانده کاربردی‌ترین شبکۀ استفاده‌شده در مسائل خوشه‌بندی است؛ زیرا پس از آموزش شبکه، می‌توان از ابزارهای بصری‌سازی آن برای تجزیه‌و‌تحلیل خوشه‌های حاصل استفاده کرد. از نقشه‌های خود‌سازمانده برای خوشه‌بندی داده‌ها و کاهش ابعاد داده‌ها استفاده می‌شود. در پژوهش حاضر برای خوشه‌بندی داده‌های بلوک آماری از دو الگوریتم شبکه‌های عصبی خودسازماندۀ SOM و Geo-SOM استفاده شد. هدف اصلی پژوهش حاضر اعمال پارامترهای مکانی در روند خوشه‌بندی شبکه‌های عصبی خودسازمانده بود که مختصات جغرافیایی داده‌های بلوک‌های آماری به‌عنوان پارامتر مکانی در کنار سایر متغیرهای ورودی به شبکه اعمال شد. ضریب سیلهوته و میانگین کلی سیلهوته در ارزیابی نتایج، نشان‌دهندۀ تأثیر مثبت پارامترهای مکانی در روند خوشه‌بندی الگوریتم Geo-SOM است؛ بنابراین الگوریتم Geo-SOM نسبت به الگوریتم SOM یک خوشه‌بندی مناسب و منسجم از بلوک‌های آماری را با‌توجه به شباهت و ویژگی‌های مکانی آنها ایجاد می‌کند. در پژوهش حاضر پتانسیل این الگوریتم در تعریف مناطق همگن و شناسایی بلوک‌های مشابه در یک مجموعه داده واقعی نشان داده شد. الگوریتم Geo-SOM مناطق همگن را بر‌اساس متغیرهای منتخب شناسایی کرد که این خود منجر به تسهیل برنامه‌ریزی‌های شهری منطبق با رویکرد توسعۀ پایدار می‌شود.

منابع
احمدی، علی، حسینی‌فر، سید محسن، و نصیری هندخاله، اسماعیل. (1395). تأثیر مهاجرت بر توسعۀ شهری با استفاده از مدل ( SWOTمورد مطالعه: شهر بابل). دو فصلنامۀ پژوهش‌های بوم‌شناسی شهری، 7(2)، 55-66.
برقی، اسماعیل (1397). سوادآموزی عنصر کلیدی توسعۀ پایدار. نشریۀ راهبرد توسعه، 14 (4)،187-210.
تقوایی، مسعود، و صفرآبادی، اعظم. (1392). توسعۀ پایدار شهری و برخی عوامل مؤثر بر آن (مورد مطالعه: شهر کرمانشاه). فصلنامۀ مطالعات جامعه‌شناختی شهری، 3(6)، 1-26.
توده فلاح، معصومه، خطیبی، آمنه، صفاکیش، محدثه، و عباسی، محمدباقر. (1397). نگاهی به ساخت سنی و وضع مشارکت در بازار کار مردان و زنان در‌معرض ازدواج و طلاق از دریچۀ سرشماری. فصلنامۀ جمعیت، 20(5)، 57-76.
سپهوند، رضا، و عارف‌نژاد، محسن. (1392). اولویت‌بندی شاخص‌های توسعۀ پایدار شهری با رویکرد تجزیه‌وتحلیل سلسله‌مراتبی گروهی (مطالعۀ موردی: در شهر اصفهان). مطالعات ساختار و کارکرد شهری، 1(1)، 43-59.
محمدزاده، رحمت. (1394). بررسی تطبیقی الگوی مجتمع‌های مسکونی ویلائی و آپارتمانی (مطالعۀ موردی: شهر جدید سهند). جغرافیا و برنامه‌ریزی، 19(54)، 297-302.
موسوی، میرسعید (1397). بررسی سطح تحقق توسعۀ پایدار شهر تبریز بر‌اساس شاخص ردپای بوم‌شناختی. جغرافیا و مطالعات محیطی، 7(27)، 61-76.
نصیری دارانی، شهربانو. (1401). تحلیل حساسیت روش ارزیابی چند‌معیارۀ مکانی به تغییر توابع استاندارد‌سازی و وزن معیارها (مطالعۀ موردی: سنجش وضعیت پایداری توسعه در شهر اصفهان). پایان نامه دکتری، دانشگاه شهید بهشتی تهران.
 
References
Ahmadi, A.‚ Hosseini Far, S. M.‚ & Nasiri Handkhale, I. (2015). The impact of immigration on urban development using the model (SWOT case study: Babol city). Journal of Urban Ecology Research, 7(2)‚ 55-66.] In Persian[.
Aldegheishem, A. (2014). Evaluating the urban sustainable development on the basis of AHP: A case study for Riyadh city. Journal of Sustainable Development, 7(2), 113. Doi: 10.5539/jsd.v7n2p113
Andrienko, G., Andrienko, N., Bak, P., Bremm, S., Keim, D., von Landesberger, T., & Schreck, T. (2010). A framework for using self-organising maps to analyze spatio-temporal patterns, exemplified by analysis of mobile phone usage. Journal of Location Based Services, 4(3-4), 200-221. Doi: 10.1080/17489725.2010.532816
Bação, F., Lobo, V., & Painho, M. (2004). Geo-self-organizing map (Geo-SOM) for building and exploring homogeneous regions. In International Conference on Geographic Information Science (pp. 22-37). Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-540-30231-5_2
Barghi, I. (2017). Literacy is the key element of sustainable development. Strategic Development Journal, 14(4)‚ 187-210. ]In Persian[.
Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). From data mining to knowledge discovery in databases. AI Magazine, 17(3), 37-37. https://doi.org/10.1609/aimag.v17i3.1230
Galutira, E. F., Fajardo, A. C., & Medina, R. P. (2019). A novel Kohonen self-organizing maps using exponential decay average rate of change for color clustering. In Intelligent and Interactive Computing (pp. 23-33). Springer, Singapore. https://doi.org/10.1007/978-981-13-6031-2_28
Grubesic, T. H., Wei, R., & Murray, A. T. (2014). Spatial clustering overview and comparison: Accuracy, sensitivity, and computational expense. Annals of the Association of American Geographers, 104(6), 1134-1156. https://doi.org/10.1080/00045608.2014.958389
Hagenauer, J., & Helbich, M. (2016). SPAWNN: A Toolkit for spatial analysis with self‐organizing neural networks. Transactions in GIS, 20(5), 755-774. https://doi.org/10.1111/tgis.12180
Hsu, K. C., & Li, S. T. (2010). Clustering spatial–temporal precipitation data using wavelet transform and self-organizing map neural network. Advances in Water Resources, 33(2), 190-200. https://doi.org/10.1016/j.advwatres.2009.11.005
Jain, A. K., Murty, M. N., & Flynn, P. J. (1999). Data clustering: A review. ACM Computing Surveys (CSUR), 31(3), 264-323. https://doi.org/10.1145/331499.331504
Kassambara, A. (2017). Practical guide to cluster analysis in R: Unsupervised machine learning (Vol. 1). Sthda.
Kaufman, L., & Rousseeuw, P. J. (2009). Finding groups in data: an introduction to cluster analysis. John Wiley & Sons.
Klösgen, W., & Żytkow, J. M. (1996). Knowledge discovery in databases terminology. In Advances in knowledge discovery and data mining (pp. 573-592).
Kohonen, T. (1995). Self-Organizing Maps, Springer Series in Information Science (Vol. 30). Springer.
Lez’er, V., Semerianova, N., Kopytova, A., & Truntsevsky, Y. (2019). Youth entrepreneurship as a basis for sustainable urban development: Social and legal aspect. In E3S Web of Conferences (Vol. 110, p. 02093). EDP. https://doi.org/10.1051/e3sconf/201911002093
Li, T., Sun, G., Yang, C., Liang, K., Ma, S., & Huang, L. (2018). Using self-organizing map for coastal water quality classification: Towards a better understanding of patterns and processes. Science of the Total Environment, 628, 1446-1459. https://doi.org/10.1016/j.scitotenv.2018.02.163
Liao, X., Tao, H., Gong, X., & Li, Y. (2019). Exploring the database of a soil environmental survey using a geo-self-organizing map: A pilot study. Journal of Geographical Sciences, 29, 1610-1624. https://doi.org/10.1007/s11442-019-1644-8
Löhr, S. C., Grigorescu, M., Hodgkinson, J. H., Cox, M. E., & Fraser, S. J. (2010). Iron occurrence in soils and sediments of a coastal catchment: A multivariate approach using self organising maps. Geoderma, 156(3-4), 253-266. https://doi.org/10.1016/j.geoderma.2010.02.025
Miller, H. J. (2010). The data avalanche is here. Shouldn’t we be digging?. Journal of Regional Science, 50(1), 181-201. https://doi.org/10.1111/j.1467-9787.2009.00641.x
Mohammadzadeh, R. (2014). A comparative study of the pattern of villa and apartment residential complexes (A case study of the new city of Sahand). Scientific Journal of Geography and Planning, 19(54)‚ 279-302. ]In Persian[.
Mousavi, M. (2017). Examining the level of realization of sustainable development of Tabriz city based on ecological footprint index. Geography and Environmental Studies Quarterly, 7(27)‚ 61-76. ]In Persian[.
Nasiri DaraniSh. (2022). Sensitivity analysis of spatial multi-criteria evaluation method to change the standardization functions and weight of criteria (Case study: assessing the sustainability of development in Isfahan). PhD Thesis. Shahid Beheshti University. [In Persian[.
Openshaw, S. (1999). Geographical data mining: Key design issues. In Proceedings of GeoComputation (Vol. 99).
Park, Y. S., Chon, T. S., Bae, M. J., Kim, D. H., & Lek, S. (2018). Multivariate data analysis by means of self-organizing maps. In Ecological Informatics (pp. 251-272). Springer, Cham. https://doi.org/10.1007/978-3-319-59928-1_12
Patel, P., & Patel, A. (2021). Use of sustainable green materials in construction of green buildings for sustainable development. IOP Conference Series: Earth and Environmental Science (Vol. 785, No. 1, p. 012009). IOP Publishing. Doi: 10.1088/1755-1315/785/1/012009
Rodrigues, M., & Franco, M. (2020). Measuring the urban sustainable development in cities through a composite index: The case of Portugal. Sustainable Development, 28(4), 507-520. https://doi.org/10.1002/sd.2005
Sepahvand, R.‚ & Arifnejad, M. (2012). Prioritization of sustainable urban development indicators with a group hierarchical analysis approach (Case study: in Isfahan city). Studies of Urban Structure and Function, 1(1), 43-59. ]In Persian[.
Sheela, K. G., & Deepa, S. N. (2012). An efficient hybrid neural network model in renewable energy systems.  IEEE International Conference on Advanced Communication Control and Computing Technologies (ICACCCT) (pp. 359-361). IEEE. Doi: 10.1109/ICACCCT.2012.6320802
Stefanovic, P., & Kurasova, O. (2011). Visual analysis of self-organizing maps. Nonlinear Analysis: Modeling and Control, 16(4), 488-504. DOI: 10.15388/NA.16.4.14091.
Stefanovic, P., & Kurasova, O. (2018). Outlier detection in self-organizing maps and their quality estimation. Neural Network World, 28(2), 106-117. DOI:10.14311/NNW.2018.28.006
Sui, D. Z. (2004). Tobler's first law of geography: A big idea for a small world?. Annals of the Association of American Geographers, 94(2), 269-277. https://doi.org/10.1111/j.1467-8306.2004.09402003.x
Taghavai, M.‚ & Safarabadi, A. (2012). Sustainable urban development and some factors affecting it (Study: Kermanshah city). Quarterly Journal of Urban Sociological Studies‚ 3(26), 1-26. [In Persian[.
Tobler, W. R. (1970). A computer movie simulating urban growth in the Detroit region. Economic Geography, 46(sup1), 234-240. https://doi.org/10.2307/143141
Tude Fallah, M.‚ Khatibi, A.‚ Safakish, M.‚ & Abbasi, M. B. (2017). Looking at the structure of age and participation in the labor market of men and women subject to marriage and divorce through the lens of the census. Population Quarterly, 20(5), 57-76. ]In Persian[.
Vesanto, J., & Alhoniemi, E. (2000). Clustering of the self-organizing map. IEEE Transactions on Neural Networks, 11(3), 586-600. DOI: 10.1109/72.846731
Wankhede, S. B. (2014). Analytical study of neural network techniques: SOM, MLP, and classifier-a survey. IOSR J. Comput. Eng. Ver. VII, 16(3), 2278-661.
Yuan, M., Buttenfield, B., Gahegan, M., & Miller, H. (2004). Geospatial data mining and knowledge discovery. In A research agenda for geographic information science (pp. 365-388). CRC Press.
Zhang, J., & Fang, H. (2012). Using self-organizing maps to visualize, filter, and cluster multidimensional bio-omics data. Applications of Self-Organizing Maps, 181-204.