Уведомления

Группа в Telegram: @pythonsu

#1 Май 6, 2016 16:31:12

megoloman
Зарегистрирован: 2015-10-26
Сообщения: 113
Репутация: +  0  -
Профиль   Отправить e-mail  

Сравнение 2х файлов очень большого объема

Здравствуйте! Подскажите пожалуйста какой способ будет наиболее рациональным для сравнения 2-х петабайтных файлов?

Офлайн

#2 Май 6, 2016 18:58:16

PooH
От:
Зарегистрирован: 2006-12-05
Сообщения: 1948
Репутация: +  72  -
Профиль   Отправить e-mail  

Сравнение 2х файлов очень большого объема

Сравнить дату изменения :)



Вот здесь один из первых отарков съел лаборанта. Это был такой умный отарк, что понимал даже теорию относительности. Он разговаривал с лаборантом, а потом бросился на него и загрыз…

Офлайн

#3 Май 6, 2016 19:27:57

megoloman
Зарегистрирован: 2015-10-26
Сообщения: 113
Репутация: +  0  -
Профиль   Отправить e-mail  

Сравнение 2х файлов очень большого объема

Сравнить к примеру на наличие недостающих данных, суть в том, каким образом с такими большими объемами лучше работать?

Офлайн

#4 Май 6, 2016 19:56:23

doza_and
От:
Зарегистрирован: 2010-08-15
Сообщения: 4138
Репутация: +  252  -
Профиль   Отправить e-mail  

Сравнение 2х файлов очень большого объема

А что вы понимаете под сравнением? Что будет получаться в результате сравнения? Если они петабайтные, то это уже наверное уже и не файлы. На чем размещено?
Операция достаточно стандартная легко гуглится.

http://stackoverflow.com/questions/29226212/comparing-two-text-files-using-hadoop-map-reduce

Довольно неплохо себя показал на суперЭВМ распределенный hdf5 файл. Для него есть утилиты сравнения файлов.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version