Juan-Carlos Gandhi (
juan_gandhi) wrote2010-01-19 04:44 pm
![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
задача с интервью
Есть огромный диск (ну типа gfs); там миллионы фолдеров, короче, большое дерево. Надо построить график, по оси X дата, по оси Y сколько файлов модифицировано в тот день.
Есть несколько машин. Организуйте производство. В смысле, чтобы они трудились эффективно и произвели нужный результат за осмысленное время.
Есть несколько машин. Организуйте производство. В смысле, чтобы они трудились эффективно и произвели нужный результат за осмысленное время.
no subject
no subject
no subject
no subject
wfs - это width first search
Я, кстати, не верю, что будет всё равно, читать ли директории с одной машины или с кучи машин.
no subject
no subject
no subject
я бы делал так:
главный процесс раздаёт фолдеры всем машинам из очереди (начальный стейт очереди "/" (root)) ,
на каждой машине клиентский процесс берет фолдер из раздатчика, траверсит, файлы добавляет в локальный мап date/number, фолдеры отдаёт распределяющему процессу.
как очередь кончится, все процессы отдают мапы главному для слияния по датам.
главный процесс может ранниться на одной машине с клиентским, остальные машины - только клиентский.
no subject
no subject
обычный find first/find next только последовательный
no subject
если студент прослушал курс по параллельным системам, он сразу же ответит.
no subject
no subject
no subject
no subject
no subject
no subject
no subject
network drive с несколькими клиентами?
сканируем фолдер, если попался сабфолдер - выкладываем в общую очередь. файлы процессим. по исчерпанию - лезем в общую очередь за очередным фолдером.
no subject
no subject
no subject
no subject
Re: у GFS директории уже не поделены между машинами?
По следам GFS: Evolution on Fast-forward:
А метаданные живут под одним мастером на одной ячейке.
А мастер, как известно, загибается.
Зато есть мультиячейки.
no subject
Re: map-reduce обычный?
http://www.h-online.com/open/news/item/Google-patents-Map-Reduce-908602.html
Re: map-reduce обычный?
PS: хочется верить, что это действительно defensive.
Re: Как можно запатентовать то, что ты не изобрел
История кишит такими примерами.
Кто успел, тот и съел!
Ну, дык, они заявляют, что они - белые и пушистые, что никому зла не желают, починяют примус...
А там, конечно, посмотрим, может это - своеобразная форма американского юмора.
Re: Как можно запатентовать то, что ты не изобрел
no subject
Это задача на организацию эффективного storage, или задача "как эффективно посчитать количество меченных вершин в дереве"?
Кстати, а симлинки есть?
Re: Кстати, а симлинки есть?
no subject