Венецианская машина времени - Venice Time Machine

В Венецианская машина времени крупный международный проект, запущенный École Polytechnique Fédérale de Lausanne (EPFL) и Венецианский университет Ка 'Фоскари в 2012 году, целью которого является построение совместной многомерной модели Венеция путем создания открытого цифрового архива культурного наследия города, охватывающего более 1000 лет эволюции.[1] Проект направлен на отслеживание распространения новостей, денег, коммерческих товаров, миграции, художественных и архитектурных образцов среди прочего для создания Большие данные прошлого.[2] Его выполнение будет представлять собой самую большую базу данных, когда-либо созданную по венецианским документам.[3] Проект является примером нового направления научной деятельности, появившегося в Цифровой век: Цифровые гуманитарные науки.

Широкая критическая оценка проекта привела к тому, что Европейскому комитету было подано предложение европейского партнера. Европейская комиссия в апреле 2016 г.[4] Венецианская машина времени составляет технологическую основу предлагаемых Европейская машина времени.[5]

Первая полная реконструкция Венеции, показывающая эволюцию города между 900 и 2000 годами, была показана в Венецианской Биеннале архитектуры в 2018 году.[6] Модель Венецианской машины времени 1750 года также использовалась для выставки в Гранд Пале в Париж в сентябре 2018 г.[7]

Организация и финансирование

Проект Венецианской машины времени был запущен EPFL и Университет Ка'Фоскари Венеции в 2012 году. Он включает сотрудничество с основными венецианскими родовыми учреждениями: Государственный архив в Венеции, Библиотека Марчианы, Институт Венето и Фонд Чини. В настоящее время проект поддерживается READ (Распознавание и пополнение архивных документов).Европейский проект электронной инфраструктуры, то Связанные книги проекта SNF и ANR-SNF Project GAWS. В международный совет входят известные ученые из Стэнфорд, Колумбия, Принстон и Оксфорд. В 2014, Фонд Ломбарда Одье присоединился к проекту Venice Time Machine в качестве финансового партнера.[8]

Технологии и инструменты

Государственный архив Венеции содержит огромное количество рукописной документации на языках, переходящих от средневековья до 20 век. Приблизительно 80 км полок заполнены административными документами за более чем тысячелетнюю историю, от регистрации рождений, свидетельств о смерти и налоговых деклараций до карт и планов городского планирования. Эти документы часто очень хрупкие и иногда находятся в непрочном состоянии. Разнообразие, количество и точность венецианских административных документов уникальны в истории Запада. Комбинируя этот массив информации, можно реконструировать большие сегменты прошлого города: полное биографии, политическая динамика, или даже внешний вид зданий и целых кварталов.

Сканирование

Бумажные документы превращаются в цифровые изображения высокого разрешения с помощью сканирующих машин. Различные типы документов накладывают различные ограничения на тип сканирующих машин, которые можно использовать, и на скорость, с которой документ может быть сканирован. В партнерстве с промышленностью, EPFL работает над полуавтоматическим роботизированным сканирующим устройством, способным оцифровывать около 1000 страниц в час. Для создания эффективного конвейера оцифровки, адаптированного к древним документам, будет построено несколько таких устройств. Другое решение, которое в настоящее время изучается в EPFL, включает сканирование книг без переворачивания страниц. Этот метод использует Рентгеновское синхротронное излучение произведенный ускоритель частиц.[9]

Транскрипция

Сложность графики и разнообразие рукописных документов делают транскрипцию сложной задачей. Для Венецианской машины времени ученые сейчас разрабатывают роман алгоритмы которые могут преобразовывать изображения в вероятные слова. Изображения автоматически разбиваются на части изображения, которые потенциально представляют слова. Каждое вспомогательное изображение сравнивается с другими вспомогательными изображениями и классифицируется в соответствии с формой слова, которое оно представляет. Каждый раз, когда новое слово расшифровывается, это позволяет распознать миллионы расшифровок других слов в базе данных.

Обработка текста

Затем цепочки вероятных слов превращаются в возможные предложения с помощью текстовый процессор. Этот шаг выполняется, среди прочего, с использованием алгоритмов, основанных на анализе структуры белка, которые могут идентифицировать повторяющиеся шаблоны.

Подключение данных

Настоящее богатство венецианских архивов заключается в связанности их документации. Несколько ключевых слов связывают разные типы документов, что делает данные доступными для поиска. Эта перекрестная ссылка огромных объемов данных организует информацию в гигантские графы взаимосвязанных данных. Ключевые слова в предложениях объединяются в гигантские графы, что позволяет создавать перекрестные ссылки на огромные объемы данных, тем самым позволяя возникать новые аспекты информации.

Лаборатория цифровых гуманитарных наук EPFL объявила 1 марта 2016 г. о разработке РЕПЛИКА, новая поисковая система для изучения и расширенного использования венецианского культурного наследия, которая будет доступна в Интернете к концу 2016 года.[10]

Прием

Хвалить

  • Междисциплинарность и интернационализм. Крупные венецианские патримониальные учреждения, академические учреждения и профессора, представляющие разные дисциплины и различные учреждения по всему миру, сотрудничают для достижения этих коллективных усилий. На странице Venice Time Machine описано триста исследователей и студентов из различных дисциплин (естественные науки, инженерия, информатика, архитектура, история и история искусств), которые сотрудничали в этом проекте.
  • Развитие технологий. Программа сталкивается с множеством технических проблем, связанных с преобразованием уникального и обширного культурного наследия в цифровой архив. Массовая оцифровка требует не только систематического сканирования древних рукописей, но и автоматической обработки различных стилей рукописного ввода, а также анализа латыни и некоторых других языков по мере их развития с течением времени. Например, исследователи EPFL, работающие над проектом Venice Time Machine, представили методология проанализировать языковые изменения, изучив швейцарские газетные архивы за 200 лет.[11]
  • Демократизация знаний и культуры. Проект направлен на то, чтобы открыть знания и историю для более широкой аудитории через виртуальную базу данных, к которой может получить доступ любой, тем самым улучшая связь между учеными и широкой публикой. Более того, цифровая гуманитарная наука, наоборот, направлена ​​на снижение барьеров для вклада и обмена знаниями и данными, позволяя широкой общественности вносить свой вклад в сбор данных. Элитная группа ученых и профессионалов больше не должна быть единственной, кто может вносить и распространять культурные и исторические знания, и цифровые гуманитарные науки стремятся уменьшить это.

Критика

  • Перекошенная аудитория. Весь проект, вместе с развитием технологий, который он влечет, кажется, предназначен исключительно для западной аудитории. И Венецианская машина времени, и последующая европейская машина времени сосредоточены вокруг европейской истории, культуры и родового наследия. Пока не было сделано ничего, чтобы включить больше культурной истории регионов (хотя проект и цифровые гуманитарные науки все еще находятся на начальной стадии), но все же свидетельствует о том, что европейской истории придается большее значение.[нужна цитата ]
  • Выбор содержания. Ученые и исследователи, работающие над проектом по разработке наборов данных, по-прежнему имеют право выбирать информацию, представляемую аудитории, что противоречит цели инициативы по демократизации знаний. Участвующие в проекте ученые имеют право курировать содержание и образовательную информацию венецианской базы данных.
  • Возможность для бизнеса замаскирована. Предыдущие аналогичные инициативы предполагают, что создание связи между учеными и широкой общественностью представляет собой деловую возможность для тех, кто контролирует такую ​​платформу данных. Например Google Книги и Google ученый помогли достичь Google долгосрочная стратегия, направленная на изменение привычек пользователей к поиску книг как научного, так и популярного чтения и превращение цифровых технологий в ключевое средство поиска знаний, информации и исторического прошлого.[12]
  • Этические вопросы, касающиеся больших данных. Хотя собираемые данные в основном принадлежат населению, которое жило в прошлом, тем не менее возникают те же этические проблемы, что и в случае с большими данными. Не всегда гарантируется, что сбор данных будет анонимным, например, «если паттерны человека достаточно уникальны, внешняя информация может использоваться для обратной связи данных с индивидуумом».[13] По мере того, как технологии продолжают развиваться, текущие процедуры анонимизации, вероятно, уменьшатся, согласно Джошуа Фэрфилд. Исследователи могут обнаружить, что требование согласия соответствующих семей неэффективно с точки зрения затрат.[14]

Прочие последствия

  • Программа направлена ​​на разработку множества инструментов и технологий, которые ставят под сомнение роль историки и гуманисты все вместе. Алан Лю и Уильям Г. Томас III идентифицируют в своих «Гуманитарных науках в цифровую эпоху»[15] внести свой вклад в смену парадигмы, при которой технологические инструменты становятся все более незаменимыми и полагают, что гуманисты должны определять долгосрочное цифровое будущее гуманитарных наук и, следовательно, должны проявлять инициативу, чтобы избежать создания цифровой инфраструктуры для них.

Смотрите также

Рекомендации

  1. ^ «Вкратце - ВТМ».
  2. ^ Эбботт, Элисон (2017). «Машина времени, воссоздающая социальные сети древней Венеции». Природа. 546 (7658): 341–344. Bibcode:2017Натура.546..341A. Дои:10.1038 / 546341a. PMID  28617482.
  3. ^ Каплан, Фредерик (2015). «Венецианская машина времени». Материалы Симпозиума ACM по проектированию документов 2015 г.: 73. Дои:10.1145/2682571.2797071. ISBN  9781450333078. S2CID  7114931.
  4. ^ Каплан, Фредерик (2016-04-29). "Венецианский флагман машины времени". Европейская комиссия. Получено 9 мая 2017.
  5. ^ Каплан, Фредерик (2015). «Венецианская машина времени». Материалы Симпозиума ACM по проектированию документов 2015 г.: 73. Дои:10.1145/2682571.2797071. ISBN  9781450333078. S2CID  7114931.
  6. ^ http://padiglionevenezia.it/casi/venice-time-machine/
  7. ^ "Эблуиссанте Венеция!".
  8. ^ «Партнеры - ВТМ».
  9. ^ Маргаритондо, Джорджио; Каплан, Фредерик; Hwu, Yeukuang; Печченини, Ева; Стампанони, Марко; Альбертин, Фаузия (2015). «Рентгеновская спектрометрия и визуализация древних административных рукописных документов» (PDF). Рентгеновская спектрометрия. 44 (3): 93–98. Bibcode:2015XRS .... 44 ... 93A. Дои:10.1002 / xrs.2581.
  10. ^ "Реплика". 2019-07-22. Цитировать журнал требует | журнал = (помощь)
  11. ^ Каплан, Фредерик; Борнет, Кирилл; Бантинкс, Винсент (2017). «Изучение языковых изменений в газетах за 200 лет с помощью анализа устойчивых слов». Границы цифровых гуманитарных наук. 4: 2. Дои:10.3389 / fdigh.2017.00002.
  12. ^ Гардинер, Эйлин; Мусто, Рональд Г. (2015). Цифровые гуманитарные науки: учебник для студентов и ученых. Нью-Йорк, Нью-Йорк: Издательство Кембриджского университета. п. 149. ISBN  978-1-107-01319-3.
  13. ^ де Монжуа, Ив-Александр; Hidalgo, Cesar A .; Верлейсен, Мишель; Блондель, Винсент Д. (2013). «Уникальный в толпе: границы приватности и мобильности человека». Научные отчеты. 3: 1376. Bibcode:2013НатСР ... 3Э1376Д. Дои:10.1038 / srep01376. ЧВК  3607247. PMID  23524645.
  14. ^ Фэрфилд, Джошуа; Штейн, Ханна (2014). «Большие данные, большие проблемы: новые вопросы этики науки о данных и журналистики». Журнал этики СМИ. 29: 38–51. Дои:10.1080/08900523.2014.863126. S2CID  145698329.
  15. ^ Лю, Алан; Томас III, Уильям Г. (2012). «Гуманитарные науки в цифровую эпоху». Внутри Высшего Эд.

внешняя ссылка