Jan. 30th, 2011

facepalm

Jan. 30th, 2011 12:40 pm
juan_gandhi: (Default)
Потратил дикое количество времени на казалось бы простую вещь - выдернуть из pdf определённые, легко определяемые грамматикой, кусочки.

Ну, во-первых, со скальным парсером не справился, т.к. не нашел, какой парсер, какой сканер или какой лексер не будет жрать токены, а даст мне самому определить грамматику на уровне букав. Документации-то нету, есть только примитивные примеры, или офигенного размера интерфейсы. Хрен с ним, написал руками, мне всего-то надо учитывать открывающиеся и закрывающиеся скобки.

Во-вторых, обнаружил, довольно поздно, что пидиэф же надо раззиповывать типа. Вздохнул, скачал pdfbox, стал смотреть, чего там. Потом подумал, да ё, мне ж нужен текст, ну-ка я тем же пидиэфбоксом извлеку текст, его и буду сканировать. Ну конечно, сорсы не соответствуют классам, и мейн требует какую-то команду, незадокументированную. А другому мейну нужен ещё какой-то манифест.

И тогда дошло, что самым простым способом извлечения текста из пидиэф является китайский: copy-and-paste.

Тяжело быть русским программистом - вместо того, чтобы по колее фигачить, всё заносит куда-то в сумрачный лес. Утратив правый путь во тьме долины.
juan_gandhi: (Default)
Я правильно понимаю, что если Египет вдруг станет свободной демократической страной (культурной он уже и так является, в определённом смысле), то Израилю это нож острый?
juan_gandhi: (Default)
Выходные как-то организованно прошли. У меня т.к. agile теперь дома стоит, тикеты на стенку наклеены, то, например, вчерась успел почапать на тренажере, починить калитку, купить грунт для грядки, посеять укроп, кинзу и ореган, повесить на стенку новый контроллер к поливалкам, посадить под магнолией порядочного размера кактус (в двойных перчатках работал), пропылесосить всё дома нахрен, послать ченджлист в IRS, в смысле, налоги пофиксить за 2008й год (т.к. вдруг обнаружил, что переплатил штуку), съездить в магазин купить чёрного хлеба и вафель, сварить щи, написать парсер-комбинатор для выдёргивания диаграмм из документации по xydiagram, посмотреть фильм и почти познать суть вещей. Это была суббота. О, и ещё машину съездил помыл. В связи с предстоящим дождиком зазиповал её на ночь в гараж.

А в воскресенье пошел дождик, и я что-то завалялся, а потом сидел весь день выкидывал парсер-комбинатор, писал свой парсерок (ну это фигня), вставлял примеры диаграмм в пришив, исправлял примеры (далеко не все идут, надо будет разбираться), а потом, к девяти, поехал на работу, т.к. у нас ночной релиз. Это что-то вроде парти, конечно. Народу порядочно собралось. Я-то и не нужен, скорее всего, так что занимаюсь хозяйством - ускорил вот тесты (в смысле, ещё в пятницу солюшен нашел, в три раза быстрее тикают), теперь коммитить буду; да ещё гугловскую библиотеку гуаву наконец скачал и закоммитил, теперь буду пользоваться, а там, глядишь, и другие подтянутся. Ханлонг так с удовольствием, он давно уже в курсе, да лень было возиться.

Profile

juan_gandhi: (Default)
Juan-Carlos Gandhi

September 2025

S M T W T F S
 1 2345 6
78910111213
14151617181920
21222324252627
282930    

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 7th, 2025 03:07 am
Powered by Dreamwidth Studios