
فراتر از RGB: فرمت جدید فایل تصویری که دادههای نور نامرئی را به طور مؤثر ذخیره میکند
تاریخ انتشار:
مقدمه
تصور کنید که با دوربینهای خاصی کار میکنید که نوری را ثبت میکنند که چشمان شما حتی نمیتوانند آن را ببینند—پرتوهای فرابنفش که باعث آفتاب سوختگی میشوند یا امضای حرارتی فروسرخ که نوشتارهای پنهان را فاش میکند. یا شاید از دوربینهای تخصصی استفاده کنید که به اندازه کافی حساس هستند تا تفاوتهای ظریف رنگ در رنگها را که تحت نور خاصی به درستی به نظر میرسند، تشخیص دهند. دانشمندان و مهندسان هر روز این کار را انجام میدهند و در دادههای ناشی از آن غرق شدهاند.
معرفی فرمت فشردهسازی Spectral JPEG XL
یک فرمت فشردهسازی جدید به نام Spectral JPEG XL ممکن است در نهایت این مشکل فزاینده را در تجسم علمی و گرافیک کامپیوتری حل کند. محققان آلبان فیچت و کریستوف پیترز از شرکت اینتل، جزئیات این فرمت را در مقالهای که به تازگی در Journal of Computer Graphics Techniques (JCGT) منتشر شده است، توضیح دادهاند. این فرمت به یک گلوگاه جدی برای صنایعی که با این تصاویر خاص کار میکنند، میپردازد. این فایلهای طیفی میتوانند حاوی 30، 100 یا بیشتر نقاط داده در هر پیکسل باشند که باعث میشود اندازه فایلها به چند گیگابایت برسد و ذخیره و تحلیل آنها دشوار شود.
تصاویر طیفی و جزئیات بالاتر

وقتی به تصاویر دیجیتال فکر میکنیم، معمولاً فایلهایی را تصور میکنیم که فقط سه رنگ را ذخیره میکنند: قرمز، سبز و آبی (RGB). این برای عکسهای روزمره خوب عمل میکند، اما برای ثبت رنگ واقعی و رفتار نور به جزئیات بیشتری نیاز است. تصاویر طیفی به دنبال این دقت بالاتر هستند و شدت نور را نه تنها در دستههای وسیع RGB، بلکه در دهها یا حتی صدها باند طول موج خاص و باریک ثبت میکنند. این اطلاعات دقیق عمدتاً در طیف مرئی قرار دارد و اغلب به نواحی نزدیک به فروسرخ و فرابنفش گسترش مییابد که برای شبیهسازی تعامل مواد با نور به دقت بسیار مهم است.
برخلاف تصاویر RGB استاندارد با سه کانال، این فایلها اطلاعات را در چندین کانال ذخیره میکنند که هر کدام نمایانگر شدت نور در یک باند طول موج خاص و باریک هستند. مقاله به کار با تصاویر طیفی حاوی 31 کانال متمایز اشاره میکند و حتی نمونههایی را با 81 باند طیفی نشان میدهد.
چرا به جزئیات طول موج نیاز داریم؟

چرا کسی به این سطح از جزئیات طول موج در یک تصویر نیاز دارد؟ دلایل زیادی وجود دارد. تولیدکنندگان خودرو میخواهند پیشبینی کنند که رنگ چگونه تحت نورهای مختلف به نظر میرسد. دانشمندان از تصویربرداری طیفی برای شناسایی مواد بر اساس امضای نوری منحصر به فرد آنها استفاده میکنند. و متخصصان رندرینگ به آن نیاز دارند تا اثرات نوری واقعی مانند پراکندگی (به عنوان مثال، رنگین کمانها از منشورها) و فلورسانس را به دقت شبیهسازی کنند.
به عنوان مثال، پوششهای قبلی Ars Technica نشان دادهاند که چگونه ستارهشناسان خطوط انتشار طیفی از یک انفجار پرتو گامای را تجزیه و تحلیل کردند تا مواد شیمیایی موجود در انفجار را شناسایی کنند، چگونه فیزیکدانان رنگهای اصلی را در عکسهای پیشگامانه قرن نوزدهم بازسازی کردند و چگونه تصویربرداری چندطیفی متون و حاشیهنویسیهای پنهان و قرنها قدیمی را در دستنوشتههای قرون وسطایی مانند کتاب وویچنیچ فاش کرد و گاهی حتی هویت خوانندگان یا نویسندگان گذشته را از طریق حکاکیهای سطحی کمرنگ کشف کرد.
چالشهای فرمتهای استاندارد
فرمت استاندارد فعلی برای ذخیره این نوع دادهها، OpenEXR، با این نیازهای طیفی عظیم طراحی نشده است. حتی با وجود روشهای فشردهسازی بدون افت مانند ZIP، فایلها برای کار عملی همچنان دشوار هستند زیرا این روشها با تعداد زیاد کانالهای طیفی مشکل دارند.
فشردهسازی با Spectral JPEG XL
Spectral JPEG XL از تکنیکی استفاده میکند که با تصاویر قابل مشاهده برای انسان به کار میرود، یک ترفند ریاضی به نام تبدیل کسینوس گسسته (DCT)، تا این فایلهای بزرگ را کوچکتر کند. به جای ذخیره شدت نور دقیق در هر طول موج (که فایلهای بزرگی ایجاد میکند)، این اطلاعات را به شکل دیگری تبدیل میکند.

این را به این شکل تصور کنید: وقتی به تغییر رنگ یک رنگین کمان نگاه میکنید، نیازی به ثبت هر طول موج ممکن ندارید تا آنچه را که میبینید درک کنید. DCT با تبدیل این الگوهای طول موج صاف به مجموعهای از الگوهای موجی (ضریبهای فرکانسی) کار میکند که وقتی با هم جمع میشوند، اطلاعات طیفی اصلی را بازسازی میکنند.
مهمتر از همه، سپس یک مرحله وزندهی اعمال میشود، که ضریبهای طیفی با فرکانس بالاتر را بر اساس روشنایی کلی (جزء DC) تقسیم میکند و اجازه میدهد اطلاعات کماهمیتتر به طور تهاجمیتر فشرده شوند. این سپس به کدک تغذیه میشود و به جای اختراع یک نوع فایل کاملاً جدید، این روش از موتور فشردهسازی و ویژگیهای فرمت تصویری استاندارد JPEG XL برای ذخیره دادههای طیفی به طور خاص آماده شده استفاده میکند.
کاربردهای آسانتر تصاویر طیفی
بر اساس گزارشهای محققان، اندازههای بزرگ فایلهای تصاویر طیفی به طور قابل توجهی مانع پذیرش آنها در صنایعی شده است که از دقت آنها بهرهمند میشوند. فایلهای کوچکتر به معنای زمانهای انتقال سریعتر، کاهش هزینههای ذخیرهسازی و توانایی کار با این تصاویر به صورت تعاملیتر بدون نیاز به سختافزار خاص است.
نتایج گزارش شده توسط محققان به نظر چشمگیر میرسد—با تکنیک آنها، فایلهای تصویر طیفی 10 تا 60 برابر نسبت به فشردهسازی بدون افت استاندارد OpenEXR کوچکتر میشوند و به اندازههایی معادل با عکسهای با کیفیت بالا میرسند. آنها همچنین ویژگیهای کلیدی OpenEXR مانند متاداده و پشتیبانی از دامنه دینامیکی بالا را حفظ میکنند.
در حالی که برخی اطلاعات در فرآیند فشردهسازی قربانی میشود—که این فرمت را به یک فرمت "با افت" تبدیل میکند—محققان آن را به گونهای طراحی کردهاند که جزئیات کمتر قابل مشاهده را ابتدا دور بیندازد و تمرکز فشردهسازی را بر روی جزئیات طیفی با فرکانس بالا که اهمیت کمتری دارند، حفظ کنند تا اطلاعات بصری مهم حفظ شود.
محدودیتها و آینده
البته، برخی محدودیتها وجود دارد. ترجمه این نتایج تحقیق به استفاده عملی گسترده به توسعه و پالایش مداوم ابزارهای نرمافزاری که با کدگذاری و رمزگشایی JPEG XL کار میکنند، بستگی دارد. مانند بسیاری از فرمتهای پیشرفته، پیادهسازیهای اولیه نرمافزاری ممکن است نیاز به توسعه بیشتری داشته باشند تا تمام ویژگیها را به طور کامل باز کنند. این یک کار در حال پیشرفت است.
و در حالی که Spectral JPEG XL به طور قابل توجهی اندازه فایلها را کاهش میدهد، رویکرد با افت آن ممکن است برای برخی از کاربردهای علمی معایبی داشته باشد. برخی از محققان که با دادههای طیفی کار میکنند ممکن است به راحتی این معامله را برای مزایای عملی فایلهای کوچکتر و پردازش سریعتر بپذیرند. دیگران که با اندازهگیریهای حساستر کار میکنند ممکن است نیاز به جستجوی روشهای جایگزین ذخیرهسازی داشته باشند.
در حال حاضر، این تکنیک جدید عمدتاً به رشتههای خاصی مانند تجسم علمی و رندرینگ با کیفیت بالا علاقهمند است. با این حال، همانطور که صنایع از طراحی خودرو تا تصویربرداری پزشکی به تولید مجموعههای داده طیفی بزرگتر ادامه میدهند، تکنیکهای فشردهسازی مانند این میتوانند به کار کردن با این فایلهای بزرگ کمک کنند.