উপাত্ত সংকোচন
উপাত্ত সংকোচন বা ডাটা কম্প্রেশন হলো সংকেত প্রক্রিয়াকরণ, উৎস কোডিং [১] বা বিট-হার হ্রাস করা যা আসল উপস্থাপনের চেয়ে কিছু বিট ব্যবহার করে এনকোডিং তথ্য অন্তর্ভুক্ত করে।[২] সংকোচন হতে পারে হ্রাসমূলক বা হ্রাসহীন সংকোচনের একটি। হ্রাসমূলক সংকোচনে অপ্রয়োজনীয় তথ্য চিহ্নিত করে বাদ দিয়ে কিট হ্রাস করা হয়। তথ্যের হ্রাসহীন সংকোচনে কোনো তথ্য হ্রাস পায় না। হ্রাসমূলক সংকোচনে অপ্রয়োজনীয় বা কম প্রয়োজনীয় তথ্য হ্রাসের মাধ্যমে বিট হ্রাস করে।[৩]
উপাত্ত ফাইলের আকার হ্রাসের প্রক্রিয়া প্রায়ই উপাত্ত সংকোচন হিসাবে উল্লেখ করা হয়। তথ্য রুপান্তরের ক্ষেত্রে, এটিকে সোর্স কোডিং বলা হয়। তথ্যের উৎসে এনকোডিং করা হয় সেটিকে সঞ্চিত বা রুপান্তরিত করার পূর্বে।[৪] ত্রুটি শনাক্তকরণ বা সংশোধন বা লাইন কোডিং এর ক্ষেত্রে সোর্স কোডিংকে চ্যানেল কোডিং এর সাথে মিলিয়ে ফেলা ঠিক না, সেটি শুধু তথ্যকে সংকেতে রুপান্তরের ক্ষেত্রে প্রযোজ্য।
সংকোচন কার্যকরী কারণ এটি রিসোর্স হ্রাস করে যা তথ্য সংরক্ষণ বা প্রেরণের জন্য প্রয়োজন। কম্পিউটেশনাল রিসোর্সগুলি সংকোচন প্রক্রিয়ায় হ্রাস করা হয় এবং সাধারণত, এ প্রক্রিয়ার বিপরীত (ডিম্প্রেসেশন)। উপাত্ত সংকোচন একটি স্পেস-টাইম জটিলতার ট্রেড-অফ এর বিষয়। উদাহরণস্বরুপ, ভিডিওটিকে যথেষ্ট তাড়াতাড়ি ডিকম্প্রেস করার জন্য একটি কম্প্রেশন পরিকল্পনায় ব্যায়বহুল হার্ডওয়্যার প্রয়োজন হতে পারে ভিডিও ডিকম্প্রেশন হওয়ার সময় দেখার জন্য, আর দেখার আগে ভিডিওকে সম্পূর্ণ ডিকম্প্রেশ করার অপশনটি হতে পারে অসুবিধাজনক বা এতে অতিরিক্ত স্টোরেজ প্রয়োজন। ডাটা কম্প্রেশনের নকশা পরিকল্পনা ট্রেড-অফগুলোর বিভিন্ন বিষয়সমূহের অন্তর্ভুক্ত, সংকোচনের মাত্রাসহ, গতিবিধি উপস্থাপিত হয় (হ্রাসমূলক ডাটা কম্প্রেসন ব্যবহারের সময়), আর ডাটা কম্প্রেশ বা ডিকম্প্রেশ বরতে গণনীয় রিসোর্স প্রয়োজন হয়।[৫][৬]
হ্রাসহীন
হ্রাসহীন উপাত্ত সংকোচন কোনো তথ্য না হারিয়ে উপাত্তকে পুণরায় উপস্থাপনের জন্য সাধারণত পরিসংখ্যানগত বিয়োজ্যকে কাজে লাগায়, সূতরাং প্রক্রিয়াটি প্রতিবর্তনযোগ্য। হ্রাসহীন উপাত্ত সংকোচন সম্ভব কারণ প্রকৃত-পৃথিবীর অধিকাংশ উপাত্তই পরিসংখ্যানগত বিয়োজ্য পদর্শণ করে। উদাহরণস্বরুপ, কোনো ছবিতে রঙের এমন অংশ থাকতে পারে যা বিভিন্ন পিক্সেল অনুযায়ী পরিবর্তন হয় না; "লাল পিক্সেল,..." এর পরিবর্তে উপাত্তটি হয়তো "২৭৯ লাল পিক্সেলস" হিসেবে এনকোড হবে। এটি রান-লেনথ এনকোডিংয়ের একটি মৌলিক উদাহরণ। বিয়োজ্য অপসারনের মাধ্যমে ফাইলের আকার কমানোর অনেক পদ্ধতি আছে।
লেমপেল-জিভ (এল জেড) পদ্ধতিগুলো হ্রাসহীন সংকোচন জন্য পৃথিবীর সবচেয়ে জনপ্রিয় অ্যালগোরিদমগুলোর অন্তর্ভুক্ত।[৭] নিঃসৃতকরণ হচ্ছে গতি ডিকম্প্রেশন, রেটিও সংকোচনের জন্য এল জেড অপটিমাইজড এর উপর একটি পরিবর্তন, কিন্ত এতে সংকোচন ধীরগতির হয়ে যেতে পারে। নিঃ সৃতকরন ব্যকহার করা হয় পিকেজিপ, জিজিপ এবং পিএনজিতে। লেমপেল-জিভ-ওয়েলচ জিআইএফ ছবিতে, প্রোগ্রাম যেমন, পিকেজিপে, হার্ডওয়্যার ডিভাইস যেমন, মডেমে ব্যবহৃত হয়।[৮] এল জেড সংকোচন একটি তালিকা-মূলীয় নকশা ব্যবহার করে যেখানে লিখিত বিষয় হচ্ছে পুনঃরাবৃত্তির জন্য বাতিল উপাত্তের সূত্র। বেশিরভাগ এল জেড সংকোচন ইনপুটের দিক দিয়ে পূর্বের উপাত্ত থেকে তালিকাটি প্রগতিশীলভাবে তৈরি হয়। তালিকা নিজেই প্রায় হুফমেন এনকোডেড হয়। বর্তমানে যে এল জেড-মূলীয় কোডিং ভালো কাজ করছে সেগুলো হচ্ছে ব্রোতি আর এল জেড এক্স। এল জেড এক্স মাইক্রোসফটের সিএবি ফরমেটে ব্যবহৃত হয়।[তথ্যসূত্র প্রয়োজন]
সর্বোত্তম আধুনিক সংকোচনগুলো সম্ভাব্য নকশাগুলো ব্যবহার করে যেমন,আংশিক সাদৃশ্যের পূর্বাভাস করা। বুরুজ হুইলার রুপান্তরকে গাণিতিক নকশার একটি পরোক্ষ রূপ হিসেবে দেখা যায়।[৯]
ব্যাকরণ-মূলীয় কোডগুলোর শ্রেণি জনপ্রিয়তা লাভ করছে কারণ সেগুলো পুনরাবৃত্তিমূলক ইনপুটকে ব্যাপকভাবে সংকোচিত করতে পারে, উদাহরণস্বরুপ, একই বা কাছাকাছি সম্পর্কিত প্রজাতির জীবতাত্ত্বিক উপাত্ত,একটি বড় সংস্করণ করা নথিপত্রের ভান্ডার, ইন্টারনেট সংরক্ষণাগার ইত্যাদি। ব্যাকরণ-মূলীয় কোডগুলোর মৌলিক কাজ হলো একটি প্রসঙ্গ নির্মাণ করা- মুক্ত ব্যাকরণ অপসারণের একটি একক সূত্র। অনুসরণ এবং মেরামত হচ্ছে সর্বসমক্ষে সহজলভ্য অ্যাপলিকেশনগুলোর জন্য ব্যবহারিক ব্যাকরণ সংকোচন অ্যালগরিদম।[তথ্যসূত্র প্রয়োজন]
সম্ভাব্য নকশার সরাসরি ব্যবহারের অধিকতর পরিশোধনের জন্য পরিসংখ্যানগত অনুমানগুলো একটি অ্যালগোরিদমে মিলিত হতে পারে, যাকে গণনা কোডিং বলে। গণনা কোডিং একটি আরও আধুনিক কোডিং কৌশল, যেটি ইনপুট উপাত্ত চিহ্নগুলোর একটি অনুবর্তীতা থেকে এনকোড হওয়া বিটগুলোর একটি সূত্র তৈরির জন্য একটি সসীম সীমানা যন্ত্রের একটি গাণিতিক হিসাব ব্যবহার করে। এটি উচ্চতর সংকোচন অন্যান্য কৌশলে আর্কাইভ করতে পারে যেমন, বহুল পরিচিত যেমন হুফম্যান অ্যালগোরিদম। এটি যেসব স্বতন্ত্র উপস্থাপনাগুলো পূর্ণ সংখ্যার বিট ব্যবহার করে সেগুলো থেকে একের পর এক স্বতন্ত্র ইনপুট চিহ্ন ম্যাপিং প্রয়োজনীয়তা এড়ানোর জন্য একটি অভ্যন্তরীন স্মৃতি অংশ ব্যবহার করে অার উপাত্ত চিহ্নগুলোর সূত্র এনকোডের পর এটি অভ্যন্তরীণ স্মৃতিকে মুছে দেয়। গণনীয় কোডিং বিশেষকরে ভালোভাবে অভিযোজিত উপাত্ত সংকোচনের কাজগুলোতে যেখানে অনেকগুলো পরিসংখ্যান এবং প্রসঙ্গ-নির্ভরশীল, তত সহজে ইনপুট উপাত্তের সম্ভাব্য বিন্যাসের একটি অভিযোজিত নকশার সাথে সংযুক্ত হতে পারে। গণনীয় কোডিং এর একটি উদাহরণ ছিল এটিকে বিকল্প হিসেবে ব্যবহার করা (কিন্তু ব্যাপকভাবে ব্যবহার হতো না) জেপিইজি ছবির কোডিং মানের একটি বৈশিষ্ট্য।[১০] এটি তখন থেকে ভিডিও কোডিং এর অন্যান্য অনেক নকশায় ব্যবহার করা হচ্ছে, যেগুলোর মধ্যে রয়েছে এইচ.২৬৩, এইচ ২৬৪/এমপিইজি-৪, এভিসি এবং এইচইভিসি।[১১]
হ্রাসমূলক
হ্রাসমূলক উপাত্ত সংকোচন হ্রাসহীন উপাত্ত সংকোচনের বিপরীত। ১৯৮০ সালের পরে, ডিজিটাল ছবিগুলো সার্বজনীন হয়ে গেলো এবং উদিতভাবে তাদের সংকোচনের জন্য মানসম্পন্ন। ১৯৯০ সালের শুরুতে, হ্রাসমূলক সংকোচন বিশ্বব্যাপী ব্যবহৃত হতে শুরু করল।[৮] এই পরিকল্পনাগুলোতে কিছু তথ্য হারানো গ্রহণযোগ্য। উপাত্তের উৎস থেকে অপ্রয়োজনীয় বিবৃতি ফেলে দিয়ে সংরক্ষণের জায়গা বাঁচাতে পারে। হ্রাসমূলক সংকোচন পরিকল্পনাগুলো মানুষ কিভাবে উপাত্তকে উপলদ্ধি করে প্রশ্নের উপর গবেষণা করে নকশা করা হয়েছে। উদাহরণস্বরুপ, মানুষের চোখ ঔজ্বল্যে রং বৈচিত্রের চেয়ে বেশি সূক্ষ্ম সংবেদনশীল। অপ্রয়োজনীয় বিটগুলোর উপাত্ত চক্রাকারে ঘোরা বন্ধ করার মাধ্যমে জেপিইজি ছবি সংকোচন অংশ হয়ে কাজ করে।[৮] সেখানে উপাত্তকে উপলদ্ধি ও হ্রাসের মধ্যে একটি অনুরূপ ট্রেড অফ থাকে। কিছু জনপ্রিয় সংকোচন প্রত্যক্ষ পার্থক্যগুলো কাজে লাগায়, মিউজিক ফাইল, ছবি, ভিডিও ব্যবহারের অন্তর্ভুক্ত।
হ্রাসমূলক ছবির সংকোচন ছবির মানের সূক্ষ ক্ষয়ের সাথে সংরক্ষণ ক্ষমতা বৃদ্ধির জন্য ডিজিটাল ক্যামেরায় ব্যবহার হয়। একইভাবে, ডিভিডিগুলো হ্রাসমূলক এমপিইজি-২ ভিডিও কোডিং ফরমেট ব্যবহার করে ভিডিও সংকোচন জন্য।
হ্রাসমূলক অডিও সংকোচনে শ্রবণযোগ্য নয় এবং কম শ্রবণযোগ্য অংশ হ্রাস করতে সাইকোকাস্টিকের পদ্ধতিগুলো ব্যবহৃত হয়। মানুষের কথার সংকোচন আরো বিশেষায়িত কৌশলে সম্পাদিত হতে পারে; বক্তৃতা কোডিং বা কথা কোডিং কখনো কখনো অডিও সংকোচনের নীতি থেকে ভিন্ন নীতি বিশিষ্ট হয়ে যায়। বিভিন্ন অডিও আর বক্তৃতা সংকোচনের মান অডিও ফরমেট সংকোচন হিসেবে তালিকাভূক্ত হয়। বক্তৃৃতা সংকোচন ইন্টারনেট টেলিফোনিতে ব্যবহৃত হয়, উদহরণস্বরুপ, অডিও সংকোচন সিডি রিপ করতে ব্যবহৃত হয় এবং অডিও প্লেয়ার দ্বারা সংকেতমুক্ত বা ডেকোডেড হয়ে যায়।[৯]
তত্ত্ব
হ্রাসহীন সংকোচনের তত্ত্বীয় পটভূমি এসেছে তথ্য তত্ত থেকে (যা অ্যালগোরিদমিক তথ্য তত্তের সাথে কাছাকাছি সম্পর্কযুক্ত) আর নড়ন-হার তত্ত থেকে এসেছে হ্রাসমূলক সংকোচন। এই সম্পর্কে পড়া বাধ্যতামূলক করেছেন ক্লাউড সেনন, যিনি ১৯৪০ এর শেষের দিকে এবং ১৯৫০ এর শুরুতে এই প্রাথমিক কাগজ প্রকাশ করেছিলেন। সংকেতযুক্তকরণ বা কোডিং তত্তও এটির সাথে সম্পর্কিত। উপাত্ত সংকোচনের ধারণাও গাণিতিক অনুমানের সাথে গভীরভাবে সম্পর্কযুক্ত।[১২]
যন্ত্র শিক্ষা
যন্ত্র শিক্ষা এবং সংকোচন কাছাকাছি সম্পর্কিত: একটি পদ্ধতি যা একটি দেওয়া অনুক্রম এর ক্রমান্বয়ে সম্ভাবনা ধারণা করে, ঐচ্ছিক সংকোচনের জন্য ধারনার জন্য যখন অনুকূল সংকোচন ব্যবহৃত হতে পারে(আগের ইতিহাসের দেওয়া সর্বোত্তম সংকোচক খোজার মাধ্যমে) তখন এটির পুরো ইতিহাস ব্যবহৃত হতে পারে (আউটপুট বিন্যাসের উপর হিসেবেয় কোডিং এর মাধ্যমে)। সাধারণ তথ্যের জন্য উপাত্ত সংকোচন উচ্চতাচিহ্ন হিসেবে ব্যবহারের জন্য এই সমানতা ব্যবহৃত হয় একটি ত্তজর হিসেবে ব্যবহৃত হয়।[১৩][১৪][১৫]
ফিচার স্পেস ভেক্টর
যাহোক একটি নতুন বিকল্প দৃষ্টি পরোক্ষ ফিচার স্পেস ভেক্টরগুলোর ভেতর মানচিত্র বা ম্যাপ সূত্র দেখাতে পারে এবং এই ফিচার স্পেস এর মধ্যে সংকোচন মূলীয় সদৃশ্যতা গণনীয় সদৃশ্যতা পরিমান করে। উভয় সংকোচক সি এর জন্য। আমরা একটি ভেক্টর স্পেস নির্ধারণ করে এক্স, যেমন ঐ সি। মানচিত্রগুলো একটি সূত্র এক্স ইনপুট করে, ভেক্টর আদর্শের ||~এক্স|| অনুরূপ। ফিচার স্পেসগুলোর একটি ক্লান্তিকর পরিক্ষা সংরক্ষণের জায়গা দ্বারা প্রতিরোধিত সকল সংকোচন অ্যালগোরিদমের নিম্নাবস্থিত হয়। ফিচার ভেক্টরগুলো তিনটি হ্রাসহীন সংকোচন পদ্ধতিকে পরিক্ষা করা বন্ধ করে দেয়, এলজেডডারলিউ, এলজেড৭৭, পিপিএম।[১৬]
উপাত্ত পাথর্ক্যকরণ
উপাত্ত সংকোচনকে উপাত্ত পার্থক্যকরণের বিশেষ ক্ষেত্র হিসেবে দেখা হয়।[১৭][১৮] উপাত্ত পাথর্ক্যকরণ একটি উৎস ও লক্ষের দেওয়া পার্থক্য তৈরির মাধ্যমে গঠিত হয়, একটি দেওয়া উৎস এবং পার্থক্যকে জোড়া দিয়ে একটি লক্ষ তৈরি করার সাথে, যখন উপাত্ত সংকোচন একটি লক্ষ দেওয়া সংকোচিত ফাইলের লক্ষটি তৈরি করে, এবং ডিকম্প্রেশন গঠিত হয় একটি সংকোচিত ফাইলের দেওয়া লক্ষ তৈরি করে। যদিও কেউ খালি উৎস উপাত্ত নিয়ে উপাত্ত সংকোচনকে উপাত্ত পার্থক্যকরণ মনে করতে পারে। সংকোচিত ফাইলটি একটি "শূন্য থেকে পার্থক্যের অনুরূপ।" এটি নিশ্চিত এনট্রপি মনে করার অনুরূপ। (উপাত্ত সংকোচনের অনুরূপ) সম্পর্কিত এন্ট্রপির বিশেষ নজির হিসেবে (উপাত্ত পার্থক্যকরণের অনুরূপ) কোনো প্রাথমিক উপাত্ত ছাড়া।
যখন কেউ সংযোগে গুরুত্ব দেওয়ার ইচ্ছা করে, সংকোচন ব্যবধান শর্ত ব্যবহার করতে পারে, যা উপাত্ত পার্থক্যকরণকে নির্দেশ করে।
ব্যবহার
অডিও
অডিও উপাত্ত সংকোচনকে প্রগতিশীল পরিসীমা সংকোচনের সাথে মিলিয়ে ফেলা ঠিক না, অডিও উপাত্তের সংক্রমণ ব্যান্ডউইথ এবং সংরক্ষণের জায়গার প্রয়োজনীয়তা হ্রাসের সম্ভাবনা থাকে। অডিও সংকোচন অ্যালগোরিদমগুলো সফটওয়্যার -এ অডিও কোডেক সম্পাদিত হয়। হ্রাসমূলক অডিও সংকোচন অ্যালগোরিদমগুলো নির্ভরতা মূল্যে উচ্চতর সংকোচন প্রদান করে এবং সমৃদ্ধ অডিও অ্যাপলিকেশনে ব্যবহৃত হয়। এই অ্যালগোর্মিগুলো কম শ্রবণযোগ্য আওয়াজের নির্ভরতা কাটানোর বা কমানোর জন্য সাইকোকাস্টিকের উপর সম্পূণভাবে নির্ভর করে, যার ফলে প্রেরণ করার জন্য সংরক্ষণ করতে সংরক্ষণের জায়গা প্রয়োজনীয়তা হ্রাস করে।[২]
উভয়ই হ্রাসমূলক ও হ্রাসহীন সংকোচনে তথ্যের প্রাচুর্য হ্রাস করা হয়, সংকোচন-মুক্ত করা উপাত্তকে পুনঃউপস্থাপনের জন্য ব্যবহৃত তথ্যের পরিমান হ্রাসের জন্য পদ্ধতিগুলো কোডিং, প্যাটার্ন, সীকৃতি এবং রৈখিক অনুমান হিসেবে ব্যবহার করে।
অডিও মান, প্রেরণ, সংরক্ষণের জায়গা হ্রাসের মধ্যে গ্রহণযোগ্য ট্রেড-অফ নির্ভর করে অ্যাপলিকেসনের উপর। উদাহরণস্বরূপ, ৬৪০ এমবি কম্পেক্ট ডিস্ক (সিডি) ১ ঘণ্টার সংকোচন-মুক্ত উচ্চ নির্ভরশীল শব্দ বা মিউজিক ধরে রাখে, ২ ঘণ্টার কম মিউজিক হ্রাসহীনভাবে সংকোচন হয়,৭ ঘণ্টার মিউজিক এমপিথ্রি ফরমেটে মধ্যম বিট-হারে সংকোচিত হয়। একটি ডিজিটাল সাউন্ড রেকর্ডার সাধারণত ৬৪০ এমবির মধ্যে ২০০ ঘণ্টার স্পষ্ট বোধগম্য বক্তৃতা সংরক্ষণ করতে পারে।[১৯]
হ্রাসহীন অডিও সংকোচন একটি ডিজিটাল উপাত্তের উপস্থাপনা তৈরি করে যা, অাসল অডিও প্রবাহের সম্পূর্ণ আসলের মতো নকল থেকে সংকোচন-মুক্ত। হ্রাসমূলক সংকোচন কৌশল যেমন, ভার্বিস এবং এমপি৩ এর প্লেবেক এর মতো না। সংকোচন অনুপাত আসল আকারের ৫০-৬০% হয়[২০], যা ঐসব জাতিবাচক হ্রাসহীন উপাত্ত সংকোচনের সাথে সাদৃশ্যপূর্ণ। তরঙ্গাকৃতির জটিলতা ও আওয়াজের অবস্থানের দ্রুত পরিবর্তনের কারণে হ্রাসহীন উপাত্ত সংকোচন উচ্চ সংকোচন অনুপাত অর্জন করতে অক্ষম। কোডেক যেমন, এফএলএসি, সোর্টেন এবং টিটিএ সিগন্যালের স্পেকট্রাম হিসাব করতে রৈখিক অনুমান ব্যবহার করে। এই অ্যালগোরিদমগুলোর মধ্যে অনেকগুলো এই ছাঁকনি [-১ ১] ব্যবহার করে স্টেকট্রামকে সামান্য হেয়োইটেন বা ফ্লাটেন করতে। যার ফলে ঐতিহ্যবাহী হ্রাসহীন সংকোচন আরো দক্ষভাবে কাজ করতে অনুমোদিত হয়। এই প্রক্রিয়াটিকে সংকোচন-মুক্তের বিপরীত করা হয়।
যখন অডিও ফাইলগুলো প্রক্রিয়াকরণ করা হয়, সবগুলোকে আরো অধিকতর সংকোচনের মাধ্যমে বা সম্পাদনার জন্য, এটি অপরিবর্তিত আসল ফাইলের (সংকোচন-মুক্ত বা হ্রাসহীনভাবে সংকোচিত) থেকে কাজের জন্য কাম্য। কিছু উদ্দেশ্যের জন্য একটি হ্রাসমূলকভাবে সংকোচিত ফাইলের প্রক্রিয়াকরণ একটি সংকোচন-মুক্ত ফাইল হতে একই সংকোচিত ফাইল সৃষ্টি করতে সাধারণত একটি সর্বশেষ ফলাফল তৈরি করে। অতিরিক্তভাবে শব্দ সংযোজন বা মিশ্রণে হ্রাসহীন অডিও সংকোচন সংরক্ষণাগারের জায়গা বা মাস্টার কপিজ হিসেবে ব্যবহৃত হয়।
কিছু সংখ্যক হ্রাসহীন অডিও সংকোচন বিন্যাস বিদ্যামান থাকে। সোর্টেন একটি আগেকার হ্রাসহীন বিন্যাস। নতুনগুলো মুক্ত হ্রাসহীন অডিও কোডেক (এফএলএসি), অ্যাপেলের অ্যাপেল হ্রাসহীন (এএলএসি), এমপিইজি-৪ এএলএস, মাইক্রোসোফটের মিডিয়া অডিও ৯ হ্রাসহীন, মানকির অডিও, টিটিএ এবং ওয়েভপ্যাক অন্তর্ভুক্ত করে। তালিকাভূক্তকরণ সম্পন্ন করতে হ্রাসহীন কোডেক এর তালিকা দেখুন।
কিছু অডিও বিন্যাস হ্রাসমূলক ফরমেটের একটি সমন্বয় এবং হ্রাসহীন সংশোধনকে বৈশিষ্ট্য প্রদান করে; এটি সংশোধনকে খুলে যেতে অনুমোদন প্রদান করে করে যাতে সহজেই হ্রাসমূলক ফাইল পাওয়া যায়। যেমন, বিন্যাসগুলো এমপিইজি-৪ এএলএস (হ্রাসহীনের কাছে পরিমাপযোগ্য), ওয়েভপ্যাক এবং অপটিম ফ্রগ ডুয়েলস্ট্রিম অন্তর্ভুক্ত করে।
অন্য বিন্যাসগুলো স্বতন্ত্র পদ্ধতি (ইংরেজি: Distinct System) এর সাথে সংযুক্ত। যেমন:
- সরাসরি প্রবাহ পরিবর্তন, সুপার অডিও সিডিতে ব্যবহৃত হয়।
- ম্যারিডিয়ান হ্রাসহীন প্যাকিং, ডিভিডি-অডিও, ডোলডি ট্রু এইচডি, ব্লু-রে এবং এইচডি ডিভিডিতে ব্যবহৃত হয়।
হ্রাসমূলক অডিও কম্প্রেশন
হ্রাসমূলক অডিও সংকোচন বিশাল পরিসরের অ্যাপলিকেশনে ব্যবহৃত হয়। অতিরিক্তভাবে সরাসরি অ্যাপ্লিকেশগুলোতে (এমপি৩ প্লেয়ার ও কম্পিউটার), ডিজিটালি সংকোচিত অডিও প্রবাহ অধিকাংশ ভিডিও ডিভিডি, ডিজিটাল টেলিভিশন, ইন্টারনেটের দর্শনের মাধ্যম, স্যাটেলাইট এবং ক্যাবল রেডিওতে ব্যবহৃত হয়,অার স্থলজ রেডিও সম্প্রচারে বেড়েই চলেছে। হ্রাসমূলক সংকোচন হ্রাসহীন সংকোচনের চেয়ে অনেক বড় সংকোচন অর্জন করে (৫-২০ শতাংশ আসল প্রবাহের উপাত্ত না বরং ৫০-৬০ শতাংশ) কম জটিল উপাত্ত খারিজ করে।[২১]
অডিও সংকোচনের নতুনত্ব ছিল সাইকোকাইনাস্টিক ব্যবহার করা যাতে বোঝা যায় যে, অডিও প্রবাহের সব উপাত্ত মানুষের শ্রবণ পদ্ধতি দ্বারা অনুভূত করা যায় না। , অধিকাংশ হ্রাসমূলক সংকোচন প্রথমে প্রত্যক্ষজ অপ্রাসঙ্গিক আওয়াজ যা, শোনা কঠিন বুঝে নিয়ে প্রত্যক্ষজ বিয়োজ্য হ্রাস করে। সাধারণ উদাহরণ যেমন, উচ্চতর ফ্রিকোয়েন্সি ও আওয়াজ যেগুলো সংঘটিত হয় উচ্চতর আওয়াজের সময়। যে আওয়াজগুলোর কম বা সম্পন্ন সঠিকতা নেই সেগুলেরে সাথে কোডেড হয়।
যখন কোনো ফাইল সংকোচন-মুক্ত বা পুনরায় সংকোচিত (ডিজিটাল প্রজন্ম হ্রাস) হয় তখন হ্রাসমূলক অ্যালগোরিদমের কারণে অডিও -এর মানকে ভোগতে হয়। এটি হ্রাসমূলক সংকোচনকে পেশাদার অডিও অ্যাপলিকেশনগুলোতে অন্তবর্তী ফলাফল জমা করতে অনুপযুক্ত করে। যেমন, সাউন্ড এডিটিং এবং মাল্টিট্রাক রেকর্ডিং। যাহোক, এরা শেষ ব্যবহারকারীদের কাছে অনেক জনপ্রিয় (বিশেষত এমপিথ্রি) যা, এক মিনিট মূল্যের মিউজিক যথেষ্ট মানে সংরক্ষণ করতে পারে।
অডিও সংকেতের কোন তথ্য প্রত্যক্ষজ প্রাসঙ্গিক সে সিদ্ধান্ত নিতে, বেশিরভাগ হ্রাসমূলক সংকোচন অ্যালগোরিদম রুপান্তর ব্যবহার করে যেমন, পরিবর্তিত পৃথক কোসাইন্ রুপান্তর (এমডিসিটি) থেকে সময় ডোমেইন নমুনা তরঙ্গাকৃতি।
কোডিং পদ্ধতিসমূহ
বেশিরভাগ সংকোচন অ্যালগোরিদম সময় ডোমেন নমুনাকৃত তরঙ্গাকৃতিগুলোকে রুপান্তর ডোমেনে পরিবর্তন করতে রুপান্তর (এমডিসিটি) যেমন, পরিবর্তিত বিযুক্ত কোসাইন রুপান্তর ব্যবহার করার মাধ্যমে কোন তথ্যটি একটি অপ্রাসঙ্গিক অডিও সংকেত সেই সিদ্ধান্ত গ্রহণ করে। একবার রুপান্তরিত হয়ে গেলে, সাধারণত ফিকোয়েন্সি ডোমেনে, অনুরূপ ফ্রিকোয়েন্সিগুলো শ্রবণযোগ্যতা অনুযায়ী বিটগুলোর স্থান নির্ণয় করতে পারে। স্পেক্টামের উপাদানগুলের শ্রবণযোগ্যতা পরিমাপ করতে শোনার একদম প্রবেশস্থল, এককালীন মাস্কিং করা হয় এই নীতিমালা ব্যবহার করা হয়- বিস্ময় যাতে অন্য পৃথক সংকেত দ্বারা একটি সংকেতকে মাস্ক করা হয় এবং কিছু ক্ষেত্রে, সময়গত মাস্কিং- যেখানে একটি সংকেতকে অন্য একটি সময় দ্বারা পৃথককৃত সংকেত দ্বারা মাস্ক করা হয়। সমান শব্দমাত্রা সমোন্নিত রেখাগুলোও ব্যবহার করা হতে পারে উপাদানের প্রত্যক্ষজ গুরুত্ব পরিমাপ করতে। মানুষের কান-মস্তিষ্কের মিশ্রণের নকশা একত্রিত হয়, এমন প্রভাবগুলোকে প্রায়ই সাইকোকাষ্টিক নকশা বলা হয়।[২২]
অন্যান্য হ্রাসমূলক সংকোচক যেমন, রৈখিক অানুমানিক কোডিং, যা বক্তৃতায় ব্যবহৃত হয় তা উৎস মূলীয় সংকেত পদ্ধতির রচয়িতা। এই সংকোচকগুলো অডিও সংকেতকে স্পষ্ট করতে আওয়াজ জেনারেটর নকশা এলএফসির সাথে মানব কন্ঠ বিস্তার) ব্যবহার করে (যেটির স্পেকট্রাম চেপটানো) কোনটাইজেসনের আগে। এলপিসিকে সাধারণ কোডিং কৌশল হিসেবে চিন্তা করা যেতে পারে: অডিও সংকেত পুনর্নির্মাণ করে রৈখিক আনুমানিক ব্যবহার করে লক্ষ সংকেতের স্পেক্ট্রাম থেকে কোডারের কোয়ানটাইজেসন নোইসকে আকার দেয়, আংশিকভাবে মাস্ক করে।[২১]
অডিওর এবং ইন্টারেক্টিভ অ্যাপ্লিকেশনের (যেমন, সেল ফোনে ডিজিটাল প্রেরণের জন্য বক্তৃতার যে কোডিং) প্রবাহ বিতরণে হ্রাসমূলক ফরমেটগুলো প্রায়ই ব্যবহৃত হয়। এ ধরনের অ্যাপলিকেশনগুলোতে উপাত্ত অবশ্যই উপাত্ত হিসেবে সংকোচিত হতে হবে, বরং সম্পূর্ণ উপাত্ত সংকোচিত হয়ে যাওয়ার পর। সব অডিও কোডেক স্ট্রিমিং অ্যাপ্লিকেশনে ব্যবহার করা যায় না , এই ধরনের অ্যাপ্লিকেশনের জন্য স্ট্রিম প্রবাহকে সাধারণত কার্যবরীভাবে বাছাই করতে একটি কোডেক নকশা করা হয়।[২১]
পদ্ধতিগুলো থেকে পাওয়া অদৃশ্য ফলাফল উপাত্তকে এনকোড এবং ডিকোড করতে ব্যবহার করা হয়। কিছু কোডেক নিখুত কার্যকারিতার জন্য একটি লম্বা অংশ বিশ্লেষণ করবে। (প্রায়ই কোডেকগুলো এনকোড এবং ডিকোডের জন্য একটি একাধিক অংশ সৃষ্টি করে, যেগুলোকে "ফ্রেম" বলে)। কোডিং অ্যালগোরিদম -এর এই সহজাত অদৃশ্যতা জটিল হতে পারে; উদাহরণস্বরূপ, যখন উপাত্তের সেখানে একটি দুই-প্রণালীর ট্রান্সমিশন থাকে, যেমন একটি টেলিফোন ফোন আলাপের সাথে গুরুত্বপূর্ণ দেরি অনুভূত মানের অধঃপতন ঘটায়।
সংকোচনের গতির বিপরীত, যা অ্যালগোরিদমের প্রয়োজনীয় ক্রিয়ার সংখ্যার সাথে সমানুপাতিক। এখানে অদৃশ্যতা নির্দেশ করে অডিওর বাধা প্রক্রিয়াজাতের পূর্বে বিশ্লেষণীয় নমুনার সংখ্যা। সর্বনিম্নতা হচ্ছে শূন্য (যেমন, যদি কোডার/ডিকোডার উপাত্ত কোন্টাইজেশনের জন্য বিটের সংখ্যা হ্রাস করে)। সময় ডোমেন অ্যালগোরিদমগুলো যেমন, এলপিসিতেও প্রায়ই কম অদৃশ্যতা থাকতে পারে, অতঃপর তাদের জনপ্রিয়তা রয়েছে টেলিফোন আলাপের বক্তৃতা কোডিং -এ। অ্যালগোরিদম যেমন, এমপিথ্রি, যাহোক, একটি বিশাল সংখ্যক বিশ্লেষণীয় নমুনা ফ্রিকোয়েন্সি ডোমেনে একটি সাইকোকাষ্টিক নকশা, অদৃশ্যতা রয়েছে ২৩ এমএসের অাপদশের পরিপেক্ষিতে বাস্তবায়নের জন্য রয়েছে (দ্বিমাত্রিক যোগাযোগের জন্য ৪৬ এমএস)।
বক্তৃতা এনকোডিং
বক্তৃতা এনকোডিং অডিও উপাত্ত সংকোচনের একটি গুরুত্বপূর্ণ বিভাগ। প্রত্যক্ষজ নকশাগুলো মানুষের কান সাধারণত যা শুনতে পায় মিউজিক -এর সাথে কিছুটা পার্থক্য তা ধারণা করতে ব্যবহৃত হয়। ফ্রিকোয়েন্সির পরিসরকে মানুষের আওয়াজ সাধারণভাবে মিউজিকের যতটা প্রয়োজন তার চেয়ে অনেক সীমাবদ্ধভাবে বহন করে নিয়ে যাওয়া প্রয়োজন হতো, আর আওয়াজটি সাধারণত কম জটিল। ফলস্বরূপ, বক্তৃতা অল্প বিটরেট - এ উচ্চ মানে এনকোড করা যেতে পারে।
সংকোচনীয় উপাত্ত যদি অ্যানালগ হয় (যেমন, একটি ভোল্টেজ যা সময়ের সাথে ভিন্ন হয়) এটিকে ডিটিটাল করে সংখ্যায় প্রকাশ করতে কোয়ান্টাইজেশন নিযুক্ত হয় (সাধারণত পূর্ণসংখ্যামূলক)। এটি অ্যানালগ থেকে ডিজিটাল রুপান্তরকে নির্দেশিত করে। যদি পূর্ণসংখ্যাগুলো উভয় ৮ বিট কোনটাইজেশন দ্বারা উৎপন্ন হয়, তাহলে অ্যানালগ সংকেতের সম্পূর্ণ পরিসর ২৫৬ পূণর্সংখ্যাগুলোতে ভাগ হয়ে যায় এবং সংকেত মূল্য একটি ইন্টার্ভালে একই কোনটাইজ হয়ে যায়। যদি, ১৬-বিট পূর্ণসংখ্যা উৎপাদিত হয়, তাহলে অ্যানালগ সংকেতের পরিসর ৬৫৫৩৬ ইন্টার্ভালে ভাগ হয়ে যায়।
এই সম্পর্কটি উচ্চ রিসোলিউশনের মধ্যকার আপোষ স্পষ্ট করে (বিশাল সংখ্যক অ্যানালগ ইন্টার্ভাল) এবং উচ্চ সংকোচন (ছোট পূর্ণসংখ্যা উৎপাদিত হয়)। পৃথক বক্তৃতা সংকোচন পদ্ধতি দ্বারা কোয়ানটাইজেশনের এই অ্যাপলিকেশন ব্যবহৃত হয়। এটি সম্পন্ন, সাধারণভাবে, দুটি প্রবেশ পথের মিশ্রণের মাধ্যমে:
- শুধু আওয়াজ এনকোড করা যা, শুধুমাত্র মানবকন্ঠ দ্বারা তৈরি।
- মানুষের শ্রবণের সম্পূর্ণ পরিসরের অধিকতর শুধু একটি "বোধগম্য" আওয়াজ পুনর্নির্মাণ করার জন্য পর্যাপ্ত রেখে, সংকেতের বেশিরভাগ উপাত্ত দূরে ছুড়ে ফেলে দেয়। সম্ভবত, প্রথম দিকের অ্যালগোরিদমগুলো বক্তৃতা এনকোডিং এ ব্যবহৃত হয় ( এবং সাধারণ অডিং উপাত্ত সংকোচনে) এ লো অ্যালগোরিদম এবং ইউ লো অ্যালগোরিদম ছিল।
ইতিহাস
একটি বিশাল বৈচিত্র্যের অডিও কোডিং এর জন্য আইইইইতে একটি সাহিত্যরচনা সংক্ষিপ্তসার ফেব্রুয়ারি ১৯৮৮ তে একটি যোগাযোগের বাছাই করা এলাকায় পদ্ধতি প্রকাশিত হয়। যখন সে সময়ের পূর্বের কাগজপত্র ছিল, এই সংগ্রহ সমাপ্তির সম্পূর্ণ বৈশিষ্ট্য নথিভূক্ত করেছে, কার্যকরী অডিও কোডারগুলো, প্রায় প্রত্যেকটি, প্রত্যক্ষজ (যেমন, মাস্কিং), কৌশল এবং কয়েক ধরনের ফ্রিকোয়েন্সি বিশ্লেষণ আর পেছনের শেষে নোইসলেস কোাডিং। গবেষণার উদ্দেশ্যে ভালো, পরিস্কার ডিজিটাল অডিও পাওয়ার অসুবিধায় কাগজগুলোর কয়েকটি লক্ষণীয় ছিল।[২৩] জেএসএসি প্রকাশণের অধিকাংশ, হয়ত সবাই না, এমপিইজি-১ অডিও কমিটিতে সক্রিয় ছিল।
অসকার বোনেল, ইউনিভার্সিটি অব কোয়েনোজ অ্যারেস এর প্রকৌশলী প্রফেসর, পৃথিবীর প্রথম স্বয়ংক্রিয় অডিও সংকোচন বিকশিত করেন।[২৪] ১৯৮৩ সালে, জটিল ব্যান্ডের মাস্কিং এ সাইকোকাষ্টিক নীতি ব্যবহার করা প্রথম প্রকাশিত হয়,[২৫] ১৯৬৭ সালে, সে সম্প্রতি বিকশিত আইবিএম পিসি কম্পিউটারের ব্যবহারিক অ্যাপ্লিকেশন বিকশিত করতে শুরু করেন, ব্রডকাষ্ট স্বয়ংক্রিয় পদ্ধতি ১৯৮৭ সালে একই নামে চালু হয়, অডিকম। বিশ বছর পরে, পৃথিবীরপ্রায় সকল রেডিও স্টেশন বিভিন্ন কোম্পানির তৈরি একই প্রযুক্তি ব্যবহার করছিল।
ভিডিও
ভিডিও সংকোচন প্রাচূর্য হ্রাস করতে আধুনিক কোডিং কৌশলগুলো ব্যবহার করে। অধিকাংশ সংকোচন অ্যালগোরিদম এবং কোডেকগুলো দূরসংক্রান্ত ছবি সংকোচন এবং সময়গত গতি প্রতিদানের মিশ্রণ ঘটায়। ভিডিও সংকোচন তথ্য তত্ত্বের সোর্স কোডিং -এর ব্যবহারিক বাস্তবায়ন। প্রস্তুতিকালে, অধিকাংশ সংকোচন কোডেক ভিন্নতাকে সংকোচন করতে অডিও সংকোচন কৌশল সমান্তরালভাবে ব্যবহার করে, কিন্তু উপাত্ত প্রবাহগুলোকে একটি প্যাকেজে মিশ্রিত করে ফেলে।[২৬]
সংখ্যাগরিষ্ঠ ভিডিও সংকোচন অ্যালগোরিদম হ্রাসমূলক সংকোচন ব্যবহার করে। অসংকোচিত ভিডিওর একটি খুবই উচ্চ উপাত্ত হার প্রয়োজন হয়। যদিও হ্রাসহীন সংকোচন কোডেকগুলো একটি ৫-১২ এর গুণনীয়কে কাজ করে, একটি হ্রাসমূলক সংকোচন ভিডিওর ২০-২০০ এর মধ্যকার সংকোচন গুণনীয়ক থাকে।[২৭] যেমনটা, সকল হ্রাসমূলক সংকোচনে ভিডিওর মানের মধ্যে একটি ট্রেড-অফ থাকে, সংকোচন আর ডিকম্প্রেশন, এবং সিস্টেমের প্রয়োজনীয়তাগুলোর মূল্যে। উচ্চতর সংকোচিত ভিডিও দৃশ্যমান এবং বিক্ষেপণ আর্টিফেক্টগুলোকে উপস্থিত করেতে পারে।
কিছু ভিডিও কম্প্রেশন বর্গাকার পাশ্ববর্তী পিক্সেলের সমষ্টির উপর পরিচালনা করা হয়, আবার কখনো ম্যাক্রোব্লকগুলোতে। এই পিক্সেলের সমষ্টি আর পিক্সেলের ব্লকগুলোকে একটি ফ্রেম থেকে পরবর্তী ফ্রেমে তুলনা করা হয়, এবং ভিডিও সংকোচন কডেক ব্লকগুলোর মধ্যকার পার্থক্গুলো প্রেরণ করে। ভিডিওর বেশি গতির স্থানগুলোতে, বিশাল সংখ্যক পিক্সেল, যা পরিবর্তীত হচ্ছে তার সাথে বজায় থাকতে সংকোচনটিকে অবশ্যই বেশি উপাত্ত এনকোড করেতে হবে। সাধারণত বিস্ফোরণ, অগ্নিশিখা, পশুর পাল এবং কিছু পরিকল্পিত শটের সময় উচ্চ ফ্রিকোয়েন্সি বিবৃতি বিভিন্ন বিট-হারের মানের হ্রাস বা বৃদ্ধির দিকে নিয়ে যায়।
অন্যান্য পদ্ধতি, যেমন ফ্র্যাকটাল সংকোচন, অনুবৃত্তি মিলানো, বিযুক্ত ক্ষুদ্র তরঙ্গ ব্যবহার (ডিডাবলিউটি) কিছু গবেষণার বিষয় হয়েছে।
এনকোডিং তত্ত্ব
ভিডিও উপাত্ত সংকোচন একটি সিরিজ হিসেবে পুনঃউপস্থাপিত হতে পারে তথাপি ছবি ফ্রেমে। ফ্রেমের ক্রম স্থানসংক্রান্ত এবং সময়গত অতিরেক ধারণ করে, যা ভিডিও সংকোচন অ্যালগরিদমগুলো বাদ দিতে বা ছোট আকারে কোড করতে চায়। সাদৃশ্যতা ফ্রেমের মধ্যকার পার্থক্যগুলো জমা রাখা বা মানুষের দৃষ্টির প্রত্যক্ষজ বৈশিষ্ট্যগুলোকে ব্যবহার করে। উদাহরণস্বরূপ রঙের ছোট পার্থক্যগুলো উজ্জ্বলতা পরিবর্তনের চেয়ে বোধগম্য করা কঠিন। সংকোচন অ্যালগরিদমগুলো সংরক্ষণের জায়গা হ্রাস করতে এই সংকেত এলাকাগুলো জুড়ে থাকা একটি রঙের গড় করতে পারে, একই পদ্ধতিতে, যা জেপিইজি ছবি সংকোচনে ব্যবহৃত হয়।[১০] এই পদ্ধতির কয়েকটি সহজাতভাবে হ্রাসমূলক যখন অন্যগুলো আসল সংকোচনমুক্ত ভিডিওর সকল প্রাসঙ্গিক তথ্য সংরক্ষিত করে।
ভিডিও সংকোচনের শক্তিশালী কৌশলগুলোর একটি হলো ইন্টারফ্রেম সংকোচন। ইন্টারফ্রেম সংকোচন এক বা তার আগের অথবা পরের ফ্রেম একটি ক্রমে ব্যবহার করে, কার্যকরী হচ্ছে ছবি সংকোচনে।[২৮]
সবচেয়ে শক্তিশালী ব্যবহৃত পদ্ধতিগুলো ভিডিওর প্রতিটি ফ্রেমের সাথে পূর্ববর্তী ফ্রেমের সাথে তুলনা করে কাজ করে। যদি এমন ভিডিও এমন স্থানগুলো বহন করে যেখানে কিছু সম্প্রসারণ করা হয়নি, তাহলে পদ্ধতিটি একটি সংক্ষিপ্ত নির্দেশ প্রেরণ করে যা পূর্ববর্তী ফ্রেমের অংশ অনুকরণ করে, বিটের জন্য বিট, পরেরটিতে। যদি ফ্রেমের শাখাগুলো একটি সাধারণ পদ্ধতিতে সম্প্রসারণ হয়, সংকোচকটি একটি (সামান্য দীর্ঘ) নির্দেশ প্রেরণ করে যা ডিকম্প্রেসরকে অনুকরণটি পরিবর্তন করতে, ঘুরাতে, আলোকিত বা অন্ধকার করতে বলে। এই দীর্ঘ আদেশ তাও ইন্টারফ্রেম সংকোচনের চেয়ে অনেক সংক্ষিপ্ত থেকে যায়। ইন্টারফ্রেম সংকোচন যেসব প্রোগ্রাম দর্শক দ্বারা প্লেব্যাক করা যেতে পারে সেগুলোতে ভালো কাজ করে, কিন্তু যেসব ভিডিও ক্রমের সংযোজন প্রয়োজন হয় সেগুলোতে সমস্যা সৃষ্টি করতে পারে।[২৯]
কারণ ইন্টারফ্রেম সংকোচন এক ফ্রেম থেকে অন্য ফ্রেম এর উপাত্ত অনুকরণ করে, যদি আসল ফ্রেম সাধারণভাবে কেটে যায় (প্রেরণের সময় হারিয়ে যায়), অনুসরণকারী ফ্রেমগুলো ঠিকমতো পুনর্নিমিত হয় না। কিছু ভিডিও সংকোচন যেমন, ডিভি, ইন্ট্রাফ্রেম সংকোচন ব্যবহার করে প্রত্যেকটি ফ্রেমকে স্বাধীনভাবে সংকোচন করে। ইন্ট্রাফ্রেম সংকোচিত ভিডিওতে কাট করা ততটাই সহজ যতটা সংকোচনমুক্ত ভিডিও সংযোজন করা: কেউ প্রতিটি ফ্রেমের শুরু এবং শেষ খোজে আর প্রতিটি ফ্রেমে যা সে রাখতে চায় বিটের-জন্য-বিট অনুকরণ করে এবং যে ফ্রেমগুলো রাখতে চায়না সেগুলো বাতিল করে। ইন্টারফ্রেম এবং ইন্ট্রাফ্রেম সংকোচনের আরেকটি পার্থক্য হচ্ছে, ইন্ট্রাফ্রেম পদ্ধতিতে, প্রত্যেকটি ফ্রেম একই পরিমাণ উপাত্ত ব্যবহার করে। অধিকাংশ ইন্ট্রাফ্রেম পদ্ধতিতে নির্দিষ্ট ফ্রেমগুলো (যেমন, "এমপিজি তে আই ফ্রেম) অন্য ফ্রেম থেকে উপাত্ত অনুকরণ করতে অনুমোদিত নয়, অতএব, তাদের নিকবর্তী অন্য ফ্রেমের চেয়ে বেশি উপাত্ত প্রয়োজন হয়।[২১]
আইফ্রেম সংযোজিত হওয়ার সময় সৃষ্ট সমস্যা ধরতে সক্ষম কম্পিউটার মূলীয় ভিডিও এডিটর তৈরি করা সম্ভব, যখন অন্যফ্রেমগুলোরও তা দরকার। এটি নতুন ফরমেট যেমন, এইচডিভিকে ভিডিও সংযোজনে ব্যবহার করার অনুমোদিত করেছে। যাহোক, একই ছবির মানে ইন্টাফ্রেম সংকোচিত ভিডিও সংযোজনের চেয়ে প্রচুর বেশি গণনা করা শক্তি প্রক্রিয়াটি দাবী করে।
আজ প্রায় সব ভিডিও সংকোচন পদ্ধতি (যেমন, যেগুলো আইটিই-টি বা আইএসও দ্বারা মানসম্পন্ন অনুমোটিতগুলোর মধ্যে অন্তর্ভুক্ত) দূরত্ব-সংক্রান্ত বিয়োজ্য হ্রাসের জন্য বিযুক্ত কোসাইন্ রুপান্তর ব্যবহার করে। ডিসিটি যা এই বিবেচনায় বিশাল পরিসরে ব্যবহৃত হয় তা এন. আহমেদ, টি. নতরন্জন এবং কে. আর. রাও দ্বারা ১৯৭৪ সালে পরিচিতি লাভ করেছে।[৩০] অন্যান্য সংকোচন যেমন, ফ্রাক্টাল সংকোচন, অনুসরণ মিলানো বিযুক্ত তরঙ্গাকৃতি ব্যবহার কিছু গবেষণার বিষয় হয়েছিল, কিন্তু প্রয়োগিক পণ্যসমূহে ব্যবহার হয় না (স্টিল ছবি কোডার হিসেবে গতি প্রতিদান ছাড়া ক্ষুদ্র তরঙ্গে ব্যবহার ছাড়া)। ফ্র্যাক্টাল সংকোচনগুলোতে লাভ কমে আসছে, কারণ সাম্প্রতিক তত্ত্বীয় বিশ্লেষণগুলো দেখাচ্ছ যে, এই পদ্ধতিগুলোতে কার্যকারিতার অভাব রয়েছে।[২৮]
সময়রেখা
নিম্নলিখিত ছকটি আন্তর্জাতিক ভিডিও সংকোচন মানের আংশিক ইতিহাস।
সাল | মান | প্রকাশক | জনপ্রিয় বাস্তবায়ন |
---|---|---|---|
১৯৮৪ | এইচ.১২০ | আইটিইউ-টি | |
১৯৮৮ | এইচ.২৬১ | আইটিইউ-টি | ভিডিও কনফারেন্সিং, ভিডিও টেলিফোনি |
১৯৯৩ | এমপিইজি-১ পর্ব ২ | আইএসও, আইইসি | ভিডিও-সিডি |
১৯৯৫ | এইচ.২৬২/এমপিইজি-২ পর্ব ২ | আইএসও, আইইসি, আইটিইউ-টি | ডিভিডি ভিডিও, ব্লু-রে, ডিজিটাল ভিডিও সম্প্রচার, এসভিসিডি |
১৯৯৬ | এইচ.২৬৩ | আইটিইউ-টি | ভিডিও কনফারেন্সিং, ভিডিও টেলিফোনি, মোবাইল ফোনে ভিডিও (৩ জিপি) |
১৯৯৯ | এমপিইজি-৪ পর্ব 2 | আইএসও, আইসি | ইন্টারনেটে ভিডিও (ডিআইভিএক্স, এক্সভিআইডি ...) |
২০০৩ | এইচ.২৬৪/এমপিইজি-৪ এভিসি | সনি, পেনাসনিক, স্যামসাং, আইএসও, আইইসি, আইটিইউ-টি | ব্লু-রে, এইচডি ভিডিও, ডিজিটাল ভিডিও সম্প্রচার, আইপড, অ্যাপেল টিভি, ভিডিও কনফারেন্সিং |
২০০৯ | ভিসি-২ (ডাইরেক) | এসএমপিটিই | ইন্টানেটে ভিডিও, এইচডি টিভি সম্প্রচার, ইউএইচডি টিভি |
২০১৩ | এইচ.২৬৫ | আইএসও, আইইসি, আইটিইউ-টি |
সৃষ্টি সম্বন্ধীয়
সৃষ্টি-সম্বন্ধীয় সংকোচন অ্যালগোরিদমগুলো হ্রাসহীন অ্যালগোরিদমগুলোর সবচেয়ে নতুন প্রজন্ম যা, উপাত্ত সংকোচন করে (সাধারণত নিউক্লিওটাইডের ক্রমে) নির্দিষ্ট উপাত্তটাইপের গ্রহণ করা প্রচলিত এবং সৃষ্টি-সম্বন্ধীয় অ্যালগোরিদমগুলো ব্যবহার করে। ২০১২ সালে, জনস হপকিন্স বিশ্ববিদ্যালয়ের এক দল বিজ্ঞানী একটি সৃষ্টি-সম্বন্ধীন সংকোচন অ্যালগোরিদম প্রকাশ করে যা, সংকোচনের জন্য কোনো নির্দেশক জিনোম ব্যবহার করে না। হ্যাপজিপার হ্যাপম্যাপ এবং ২০-ভাজের বেশি আর্কাইভ সংকোচন (ফাইলের আকারে ৯৫% হ্রাস), আসল সাধারণ সংকোচন ইউটিলিটিগুলোর চেয়ে দ্রুততর ২-৪-ভাজ জোগাড় করে। এজন্য, চান্ডা, এইহাক এবং ব্যাডার এমএএফ মূলীয় এনকোডিং (এমএএফই) -র সাথে পরিচয় করিয়ে দেন, ক্ষুদ্রতর অ্যালেল ফ্রিকোয়েন্সি দ্বারা এসএনএস- এর শ্রেণীবিভক্ত করে, এভাবে উপাত্ত সেটকে একই ধরনের করে।[৩১] ২০০৯ এবং ২০১৩ সালের অন্য অ্যালগোরিদমগুলোর (ডিএনএজিপ ও জিনোমজিপ) ১২০০-ভাজ পর্যন্ত সংকোচন অনুপাত আছে, যা ৬ বিলিয়ন বেসপ্যায়ার ডিপ্লয়েড মানব জিনোমকে ২.৫ মেগাবাইটে সংরক্ষিত হতে অনুমোদিত করে (একটি নির্দেশক জিনোমের সাথে সম্পর্কিত এবং অনেকগুলো জিনোমের গড়)।[৩২][৩৩]
অনুকরণ
সিডি-মূলীয় কনসোল যেমন, প্লেস্টেশন ২ অনুকরণ করতে, আইএসও দ্বারা ব্যবহৃত ডিস্কের সংরক্ষণের জায়গা বিশাল পরিমানে কমিয়ে আনার জন্য উপাত্ত সংকোচন আকাঙ্ক্ষণীয়। উদাহরণস্বরূপ, ফাইনাল ফ্যান্টাসি ২.৯ গিগাবাইট। সঠিক সংকোচনে এটি হ্রাসপ্রাপ্ত হয়ে এর আকারের ৯০% হয়ে যায়।[৩৪]
দৃষ্টিভঙ্গি এবং বর্তমানে অব্যবহৃত সম্ভাবনা
এটি ধারণা করা হয় যে, বর্তমানে পৃথিবীর স্টোরেজ ডিভাইসগুলোতে সংরক্ষিত সম্পূর্ণ পরিমাণ উপাত্ত একটি অবশিষ্ট গড় গুণনীয়ক ৪.৫:১ [তথ্যসূত্র প্রয়োজন] দ্বারা বিদ্যমান সংকোচন অ্যালগোরিদমগুলোর মাধ্যমে আরো সংকোচিত হতে পারত। এটি অনুমাণ করা হয় ২০০৭ সালে, পৃথিবীর সম্বনিত তথ্য সংরক্ষণের ক্ষমতা হার্ডওয়্যার ডিজিটের ১,৩০০ এক্সাবাইট প্রদান করত। কিন্তু, যখন অনুরূপ কন্টেন্টগুলো সন্তোষজনক ভাবে সংকোচিত হয়, এটি শুধু শ্যানন তথ্যের ২৩৬ এক্সাবাইট উপস্থাপন করে। [৩৫]
আরও দেখুন
- অডিটরি মাস্কিং
- এইচটিটি সংকোচন
- কলমগ্রোভ জটিলতা
- ম্যাজিক সংকোচন অ্যালগোরিদম
- সর্বনিম্ন বর্ণনা দৈর্ঘ্য
- মোডিউলো এন-কোড
- রেন্জ এনকোডিং
- সাব-বেন্ড কোডিং
- সার্বজনীন কোড (উপাত্ত সংকোচন)
- ভেক্টর কোনটাইজেশন
তথ্যসূত্র
বহিঃসংযোগ
- Data Compression Basics (Video)
- Video compression 4:2:2 10-bit and its benefits
- Why does 10-bit save bandwidth (even when content is 8-bit)?
- Which compression technology should be used
- Wiley - Introduction to Compression Theory
- EBU subjective listening tests on low-bitrate audio codecs
- Audio Archiving Guide: Music Formats (Guide for helping a user pick out the right codec)
- "MPEG 1&2 video compression intro (pdf format)" (পিডিএফ)। সেপ্টেম্বর ২৮, ২০০৭ তারিখে মূল (পিডিএফ) থেকে আর্কাইভ করা। সংগ্রহের তারিখ মার্চ ২৯, ২০১৮।
- hydrogenaudio wiki comparison
- Introduction to Data Compression by Guy E Blelloch from CMU
- HD Greetings - 1080p Uncompressed source material for compression testing and research
- Explanation of lossless signal compression method used by most codecs
- Interactive blind listening tests of audio codecs over the internet
- TestVid - 2,000+ HD and other uncompressed source video clips for compression testing
- Videsignline - Intro to Video Compression
- Data Footprint Reduction Technology[স্থায়ীভাবে অকার্যকর সংযোগ]