DFM یک مدل اختصاصی و گرافیکی است و به گونهای طراحی شده تا در مرحلهای که انبار داده در حال مدل سازی مفهومی است، از آن پشتیبانی کند.
کار کردن با DFM کار سختی نیست و فرآیند پیچیدهای ندارد. بنابراین، تحلیلگران و کاربران غیر فنی به راحتی میتوانند از آن استفاده کنند. برای این که با این مدل آشنا شوید کافیست با مفاهیم چند بعدی از جمله ویژگی (attribute)، اندازه (measures) و سلسله مراتب (hierarchies) آشنا باشید. میتوانید از این مدل در مراحل اولیهی انبار داده استفاده و یک مدل مفهومی را برای به اشتراک گذاشتن با مشتریان طراحی کنید.
انبارهای داده (Data Warehouse) پایگاههای دادهای (Databases) هستند که توسط تصمیم گیرندگان برای تجزیه و تحلیل وضعیت موجود و پیشرفت یک سازمان استفاده میشوند. انبارهای داده بر اساس حجم زیادی از دادهها که از منابع ناهمگن در پایگاههای دادهی چند بعدی (Multidimensional Databases) ادغام شدند و به روشی بهینه شدند که برای تحلیل گران داده، قابل فهم باشد. (مانند OLAP)
دادهها در انبارهای داده بر اساس یک مدل چند بعدی سازماندهی میشوند که به مفاهیم Fact (بخش اصلی فرآیند تصمیم گیری مانند فروش و سفارشات) و Dimension (مختصاتی برای تجزیه و تحلیل یک fact مانند زمان، مشتری و محصول) وابسته هستند. هر Fact از طریق مجموعهای از اندازه گیریهای عددی مانند مقدار محصول فروخته شده، قیمت محصولات و غیره تعیین میشود.
طراحی و توسعه DW یا انبار داده نیازمند شیوههای خاص و چرخهی عمر مناسب است.
بررسی اجمالی DFM
DFM یک مدل مفهومی و گرافیکی است که به طور خاص برای طراحی چند بعدی ابداع شده است. این مدل میتواند:
- پشتیبان کارآمدی برای طراحی مفهومی است.
- میتواند محیطی را ایجاد کند که در آن جستجوهای کاربر به آسانی تعریف شود.
- بین طراحان و کاربران نهایی (End-user) با هدف شکل دهی و سازماندهی موارد مورد نیاز ارتباط ایجاد شود.
- یک پلتفرم پایدار برای طراحی منطقی ایجاد کند.
- اسناد طراحی واضح و گویا را فراهم کند. اسناد طراحی (design documentation) مجموعهای از اسناد و منابع هستند که همهی جنبههای طراحی محصول شما را در برمیگیرند.
ارائههای مفهومی که DFM ایجاد کرده شامل مجموعهای از الگوهای Fact میشود. الگوهای Fact حقایق، اندازهها، ابعاد و سلسله مراتب را توصیف میکنند. DFM علاوه بر عناصر پایهای و اساسی، شامل مجموعهی وسیعی از ایدهها برای بیان بسیاری از تفاوتهای مفهومی است که سناریوهای مدل سازی حقیقی را در پروژههایی با پیچیدگی کم یا زیاد بیان میکند. یک طرح چند بعدی که DFM آن را طراحی کرده میتواند به راحتی (یعنی نیمه خودکار) بر روی هر دو پلتفرم ROLAP و MOLAP پیاده سازی شود.
مفاهیم پایهای و اساسی DFM
یک Fact مفهومی است که با فرآیندهای تصمیم گیری ارتباط دارد. Fact به طور معمول مجموعهای از رویدادهایی است که در داخل یک شرکت اتفاق میافتد. نمونههایی از Fact در حوزه تجاری شامل فروش، ارسال، خرید و شکایات میشود.
یک اندازه یا Measure یک ویژگی عددی از یک Fact است که ویژگی کمی (نه کیفی) را که مربوط به تجزیه و تحلیل است توصیف میکند. به عنوان مثال، هر فروش با تعداد واحدهای فروخته شده، قیمت واحد و مجموع دریافتها اندازه گیری میشود.
بُعد یا Dimension یک ویژگی با دامنه محدود است که مختصات تجزیه و تحلیل Fact را توصیف میکند. یک Fact به طور کلی دارای ابعاد متعددی است که حداقل جزئیات آن را تعریف میکند و ارائه میدهد. ابعاد رایج برای فکت فروش شامل محصولات، فروشگاهها و تاریخها میشوند. و در هر کدام از آنها اطلاعات پایهای و اساسی مانند فروش محصولات در یک فروشگاه و در یک روز ارائه میشوند.
یک Fact با یک کادر نشان داده میشود که نام Fact را به همراه نام Measure ها نمایش میدهد. دایره های کوچک Dimension را نشان میدهند که با خطوط مستقیم به Fact وصل شدند (شکل ۱ را ببینید).
شکل ۱
یک ویژگی ابعادی یا Dimensional Attribute مشخصهای با دامنه محدود و دارای یک بُعد است. این ویژگی مانند Dimension با یک دایره نشان داده میشود. برای مثال، یک محصول ممکن است بر اساس نوع، طبقه بندی و برند آن توصیف شود و یا یک مشتری ممکن است، با شهر و ملت خود نشان داده شود. روابط بین ویژگیهای ابعادی (Dimension) با سلسله مراتب بیان میشود.
یک Hierarchy یا سلسله مراتب، یک الگوریتم قاعده مند است که گرههای آن ویژگیهای ابعادی (Dimensional Attributes) هستند و منحنیها (Arcs) و خطوط آن ارتباطات متعدد بین یک جفت Dimensional Attribute را مدل سازی میکنند. سلسله مراتب (Hierarchy) شامل ابعادی (Dimension) است که در پایین این الگوریتم قرار دارد. خطوط منحنی یا arcs ها به صورت گرافیکی با خطوط مستقیم که ویژگیهای ابعادی را به هم متصل میکنند، نشان داده میشوند. سلسله مراتب نحوه انتخاب شدن و ترکیب رویدادهای اصلی کسب و کار را برای فرآیندهای تصمیم گیری تعریف میکنند.
مفاهیم پیشرفته DFM
یک ویژگی توصیفی (Descriptive Attribute) کیفیت یک Dimension Attribute را مشخص میسازد. از ویژگیهای توصیفی (Descriptive Attributes) نمیتوان برای جمع آوری و ترکیب استفاده کرد. آنها همیشه مانند برگهای یک درخت و سلسله مراتب هستند و به صورت گرافیکی با خطوط افقی نشان داده میشوند مانند “شماره تلفن” در شکل ۲.
شکل ۲
“ویژگی چند بعدی” ( Cross-dimensional attribute) یک ویژگی ابعادی (Dimensional) یا توصیفی است که ارزش آن با ترکیب دو یا چند ویژگی ابعادی که احتمالاً متعلق به سلسله مراتب مختلفی هستند، تعریف میشود. برای مثال، اگر مالیات بر ارزش افزوده بسته بر اساس نوع محصول و کشوری که محصول را میفروشد اعمال میشود، شما میتوانید از یک ویژگی چند بُعدی برای نشان دادن آن استفاده کنید. در شکل ۲ یک نیم دایره خطوط منحنی را که مالیات بر ارزش افزوده محصول را تعریف میکنند، بهم متصل کرده و مثالی را که بیان کردیم توصیف میکند.
همگرایی و Convergence زمانی اتفاق میافتد که دو ویژگی ابعادی (Dimensional Attribute) در یک سلسله مراتب و با دو یا چند مسیر جایگزین و از طریق چندین ارتباطات به یکدیگر متصل میشوند. همگرایی از طریق رسیدن دو یا چند منحنی و خطوط کج به یک ویژگی ابعادی یکسان نشان داده میشوند.
از منحنیهای بصری (Optical arcs) برای مدل سازی سناریوهایی استفاده میشود که برای آنها یک ارتباط در الگوی Fact و برای زیر مجموعهای از رویدادها تعریف نشده است. Optical arcs با یک خط کوتاه و تیره مشخص میشود. برای مثال، رژیم غذایی در شکل ۲ موادی مانند کلسترول، گلوتن یا قند را فقط برای محصولات غذایی در نظر میگیرد و برای سایر محصولات تعریف نشده است.
شکل ۳
یک منحنی چندگانه (Multiple arc) یک رابطهی چندگانه را که دو ویژگی ابعادی (Dimension) را به هم متصل میکند، مدل سازی میکنند. منحنی چندگانه از لحاظ بصری با دو برابر شدن خطی که خط منحنی را نشان میدهد، مشخص میشود. مدل سازی الگوی Fact فروش کتابها را که در شکل ۳ نشان داده شده است، در نظر بگیرید. dimension آنها تاریخ و کتاب است. قطعاً جمع آوری و انتخاب فروش بر اساس نویسندگان کتاب جالب خواهد بود.
با این حال، مدل سازی نویسنده به عنوان ویژگی ابعادی کتاب ( dimensional attribute) دقیق نخواهد بود، چون یک کتاب ممکن است بیش از یک نویسنده داشته باشد و نویسندگان میتوانند بیش از یک کتاب بنویسند. به همین دلیل، رابطهی بین کتابها و نویسندگان به عنوان یک منحنی چندگانه (multiple arc) طراحی شده است.
2 پاسخ
بسیار مفید بود .
با سلام
خیلی ممنون بابت نطرتون.