Електронні архіви для промисловості

  1. Серйозна проблема багатьох промислових підприємств - величезна кількість паперових документів, що не...
  2. Індексація документів
  3. Наповнення електронного архіву
  4. Архів для видобувних підприємств
  5. машинобудівний архів
  6. Архів для проектувальників
Серйозна проблема багатьох промислових підприємств - величезна кількість паперових документів, що не дозволяє оперативно отримувати доступ до інформації навіть при наявності ефективної системи зберігання. Переклад конструкторської, технічної та технологічної документації в електронний вигляд і створення електронного архіву стали необхідними умовами інформаційної підтримки роботи підприємства.

Часто інформація не приносить очікуваної віддачі через складність доступу до паперових архівів і робочої документації. Стають необхідними переклад конструкторської, технічної та технологічної документації в електронний вигляд, створення електронних архіву підприємства, баз даних і картотек.

Переваги електронного архіву конструкторської та технологічної документації перед архівом паперовим очевидні. Електронний архів дозволяє принципово вирішити проблему оперативного доступу. Ефективність використання документів багаторазово підвищується за рахунок зручності електронного архіву, можливості одночасної роботи з одними і тими ж документами, швидкого створення і аналізу по заданому ознакою добірок документів. Забезпечується віддалений доступ до документів співробітників територіально розподілених підрозділів. Цифрові документи не руйнуються з часом і можуть зберігатися практично вічно. Крім того, вирішується проблема цілісності документації: не секрет, що паперові документи іноді безслідно зникають в силу форс-мажорних обставин або зі злого наміру, а при правильній організації зберігання електронних документів їх несанкціоновані видалення і модифікація неможливі.

Прикладів створення і експлуатації електронних архівів багато. Бухгалтерії промислових підприємств переводять свої документи в електронний вигляд для забезпечення швидкого доступу до них, підготовки звітності та аналітичних добірок. Кадрові служби, особливо на великих підприємствах, створюють електронні картотеки персональних даних, які потрібно зберігати протягом визначеного законодавством терміну. В системи автоматизованого проектування переноситься конструкторська і технологічна інформація.

Для обробки накопичених масивів паперової документації промисловим підприємствам часто вигідніше замовляти її оцифровку у спеціалізованих компаній. Виділення власних ресурсів для створення непрофільного підрозділу, який по завершенні робіт доведеться розформувати або перепрофілювати, може виявитися недозволеною розкішшю. Витрати на переклад документації в електронний вигляд силами самого підприємства можуть виявитися в півтора-два рази більшими; не виключено, що цю роботу не вдасться виконати в термін.

Реалізація великих проектів перекладу в електронний вигляд сотень тисяч і навіть мільйонів документів часто виявляється не під силу підприємствам навіть при наявності відповідних технічних засобів. Занадто велика в цьому процесі роль методології і досвіду, надто великий ризик втрати інформації через людський фактор або збоїв обладнання. У таблиці наведено приблизний економічний розрахунок для проекту архівування 11 млн. Документів формату А4, що включає розшивку документів, їх переклад в електронний вигляд, індексацію за датою створення та номером і вичерпну верифікацію.

Тривалість цього проекту спочатку оцінювалася в два роки, але силами спеціалізованих постачальників роботу його вдалося виконати за один рік при вартості 577 тис. Дол.

Навіть при відносно невеликому обсязі архіву іноді вигідніше доручити його переклад в електронний вигляд сторонньому виконавцю. У процесі виконання робіт можуть виявитися безліч статей витрат, які не були передбачені або здавалися малозначними. За плановану суму ніхто не зможе гарантувати отримання результатів необхідної якості, а у випадку з зовнішнім підрядником оплачується лише кінцевий результат, а ризик знижується.

Технологія масового переведення документів в електронний вигляд має на увазі наступні етапи роботи.

I. Документація перекладається в електронний вигляд з використанням потокового сканування. В результаті створюються точні електронні копії документів з усіма артефактами (підписи, печатки, штампи і т.д.).

II. Електронні документи піддаються індексації по різних інформаційних полях (тип документа, номер справи, дата створення і ін.). При необхідності електронна форма може бути додатково оброблена: тексти розпізнаються, а графіка (креслення, схеми і т.п.) векторизуется, що дозволяє зробити електронний документ математичною моделлю для застосування в інструментальних середовищах або системах автоматизованого проектування.

III. Документи заносяться в електронний архів, який в подальшому може стати основою для автоматизованої обробки всієї технічної і технологічної інформації компанії.

Переклад документів в електронний вигляд

Для оцифровки великого обсягу документації використовується професійне обладнання. Робота на простих планшетних сканерах може затягнутися і не завжди забезпечує належну якість.

Листові документи формату до А3 зазвичай скануються на протяжних документних сканерах, які, в залежності від моделі, забезпечують оцифровку від 200 до 460 сторінок на хвилину. На одному сканері цілком реально переводити в електронний вигляд до 30 тис. Документів в день, причому професійне обладнання дозволяє працювати зі старими і пошкодженими документами.

Зшиті документи, книги, креслення, великоформатні документи, об'ємні предмети скануються на планетарних сканерах. У цих пристроях сканований оригінал нерухомий і розташовується лицьовим боком догори на значній відстані від оптичної системи і скануючої лінійної матриці сканера. Такий тип сканування дозволяє уникнути контакту зі сканирующими елементами і забезпечує збереження оригіналів. За допомогою планетарних сканерів здійснюється високоякісна оцифровка документів, що особливо важливо, наприклад, при створенні електронних бібліотек креслень.

На цьому етапі вибираються оптимальні показники сканування - чорно-білі або кольорові образи, дозвіл відсканованих документів, параметри постобработки образів.

Індексація документів

При уявній простоті процес індексації документів складний і з організаційної, і з технологічної точки зору. У випадку з великими документальними масивами автоматичне розпізнавання спеціальними програмами застосовується вкрай рідко: відсоток помилок досить великий. Найчастіше при індексації необхідно забезпечити не більше одного помилкового символу на 1 тис. Введених - недосяжна поки точність для подібних систем. Тому відскановані матеріали обробляються поетапно за допомогою комбінації ручних і автоматичних методів.

На першому етапі здійснюється попередня підготовка. Відскановані образи очищаються, фахівці готують довідники і класифікатори, на основі яких буде проводитися обробка, створюються форми для заповнення.

На другому етапі складаються нормативи для операторів і завдання для розподіленої обробки. Документ розбивається на групи полів, за які відповідають конкретні оператори, досконально вивчили нюанси їх обробки. На цьому ж етапі здійснюється оптимізація - однотипні роботи групуються.

Третій етап - багатоступенева процедура верифікації за допомогою засобів СУБД, докладного протоколювання робіт і процедури «подвійного введення» (два оператора вводять одну і ту ж інформацію, а потім ці варіанти сличаются на предмет несуперечності). Потім інформація в необхідному форматі вивантажується в результуючу базу даних.

Наповнення електронного архіву

Після перекладу документів в електронний вигляд їх можна занести в електронний архів. Наприклад, на багатьох підприємствах вже існує інформаційна система (така, як ERP), здатна обробляти електронні документи.

Головна вимога до електронного архіву - забезпечення схоронності документів. Повинно бути передбачено системне ведення архіву, включаючи збереження всіх версій документів після кожної зміни, без можливості знищення версій (тільки виключення із доступу). В електронному архіві необхідні і засоби відновлення даних після збоїв. Важливим є забезпечення безпеки даних: професійна архівна система, по-перше, надає доступ до документів строго відповідно до політики безпеки, а по-друге, веде докладний протокол роботи з архівом.

Зберігання електронного документа має на увазі зберігання всіх його атрибутів - підписів, печаток, позначок і т.д. При друку документа повинен повністю зберігатися формат його виведення: користувачеві необхідна можливість зробити повний дублікат документа.

Система підтримки електронного архіву повинна забезпечувати максимально зручне універсальне уявлення документа в базі даних:

  • документ повинен забезпечуватися повною пошукової та атрибутивною інформацією (картка документа, рядок SQL-таблиці);
  • система повинна підтримувати зберігання пов'язаних мультимедійних даних (відео, анімація, звук);
  • формат подання електронних документів повинен бути універсальним.

Якщо ж інформаційна система підприємства не задовольняє вимогам архівного зберігання даних, вона зазвичай розробляється на основі будь-якої професійної системи управління електронним архівом і інтегрується в інформаційну систему підприємства. Надалі електронний архів може стати основою для автоматизованої обробки всієї технічної і технологічної інформації компанії.

Сергій Миронов ( [email protected] ) - заступник директора корпорації «Електронний архів» (Москва).

Архів для видобувних підприємств

Створені кілька десятиліть назад документи по свердловинах поступово приходять в непридатність, і їх переклад в електронний вигляд стає єдиною можливістю зберегти унікальні відомості. Для нормальної роботи в сучасних умовах потрібне створення електронних архівів.

Для нормальної роботи в сучасних умовах потрібне створення електронних архівів

Проект, реалізований корпорацією «Електронний архів» для одного з найбільших російських нафтогазових підприємств, передбачав переклад в електронний вигляд 1,5 млн великоформатних схем, креслень і організаційно-розпорядчої документації. Ця інформація була розрізнений масив документів різних типів і форматів (від А4 до рулонів А0). Співробітники підприємства спробували сканувати документи власними силами, однак незабаром керівництво прийшло до висновку, що настільки великий і різноманітний масив документів неможливо обробити без спеціального центру сканування.

Співробітники підприємства спробували сканувати документи власними силами, однак незабаром керівництво прийшло до висновку, що настільки великий і різноманітний масив документів неможливо обробити без спеціального центру сканування

Дійсно, якісно відсканувати 20 тис. Стрічок самописців довжиною до 7 м дуже складно: необхідний не тільки високоякісне обладнання, а й досвід проведення таких робіт. Можуть виникнути проблеми з перекладом документів в електронний вигляд, з упорядкуванням масиву електронних образів і створенням індексних полів.

Мал. 1. Документи свердловин, створені кілька десятиліть тому, поступово приходять в непридатність

Мал. 2. Фрагмент електронного архіву геологорозвідувальної інформації

машинобудівний архів

Московське машинобудівне виробниче підприємство «Салют» спеціалізується на виготовленні та обслуговуванні авіадвигунів, вузлів і деталей для літаків конструкторських бюро ім. Сухого, Туполєва, Берієва і Антонова. Картотека обліку вживаності технологічного обладнання ведеться на підприємстві з середини 50-х. За цей час вона розрослася до 300 тис. Документів, і працювати з нею ставало все важче. Було прийнято рішення створити електронну картотеку.

Фахівці заводу розробили необхідну структуру бази даних електронної картотеки, але базу даних ще належало наповнити. Переклад картотеки в електронний вигляд ускладнювався її неоднорідністю: картки були різної якості, зустрічалися старі і пошкоджені, виконані на нестандартних бланках. У ряді випадків доводилося проводити міні-експертизи для оцінки та розпізнавання різних частин картотеки.

Істотні труднощі виникли і з індексацією відсканованих документів. Багато поля містили складні комбінації цифр і букв (латинських і кирилиці), правильно розібрати які виявилося непросто через нерозбірливості почерку авторів. Багатоваріантність розташування даних деяких полів карток, присутність нестандартних відомостей, велика кількість взаємопов'язаних позначень і т.п. - все це зумовило застосування особливих організаційних і технічних заходів для підвищення якості та оперативності роботи. Важливим завданням була ретельна верифікація даних по ключовому полю «шифр інструменту» (єдиному полю, унікально ідентифікує інструмент), і були встановлені особливі вимоги до якості - не більше одного помилкового символу на 1 тис. Введених.

Реалізація проекту власними силами при відсутності поточного скануючого обладнання, виділених співробітників, технологій і спеціального програмного забезпечення зайняла б кілька років. Наприклад, сканування на звичайному планшетному сканері зажадало б два з половиною роки.

Після впровадження електронної картотеки на заводі «Салют» на порядок зменшився час пошуку інформації, з'явилася можливість одночасної роботи з картотекою декількох співробітників. Крім того, була створена система контролю за цілісністю картотеки, істотно скоротилися трудовитрати на обслуговування і поповнення картотеки, вдалося вирішити проблему нестачі вільного місця в архівному сховищі.

Архів для проектувальників

Серед невирішених завдань Рязанського державного приладобудівного заводу значилися надання підприємствам-суміжників копій конструкторської документації та підготовка креслень для завантаження в системи автоматизованого проектування. Інформаційний ресурс підприємства складався з 30 тис. Документів на різних носіях - кальці, синьки, плівці, папері.

Основний масив документів формату А4 та А3 співробітники корпорації «Електронний архів» сканували на території заводу, а документи формату А2, А1 і А0 перевозили в Центр сканування. Були отримані чорно-білі графічні образи конструкторської документації в форматі TIFF, на основі яких проводилась індексація документів по полях «найменування документа», «позначення документа», «кількість листів», «номер листа». Потім була сформована база даних з інформацією про документи і посиланнями на файли з їх графічними образами, а також створений масив файлів, що містить растрові образи документів.