juan_gandhi: (Default)
Juan-Carlos Gandhi ([personal profile] juan_gandhi) wrote2020-11-25 09:05 am

кстати

Есть сильное желание бекапнуть и засунуть в гитхаб некоторые журналы из жж - прямо с дискуссиями. Чтоб сохранялось вообще. А то мало ли. 
fizzik: (Default)

[personal profile] fizzik 2020-11-25 05:17 pm (UTC)(link)
Хорошая идея.

[personal profile] zaharchenko 2020-11-25 05:34 pm (UTC)(link)
А почему именно гитхаб для бэкапов ?
dmm: (Default)

[personal profile] dmm 2020-11-25 05:56 pm (UTC)(link)
Это правда. Но руками, всё таки, сложно...
vit_r: default (Default)

[personal profile] vit_r 2020-11-25 06:00 pm (UTC)(link)
Архиваторы видел, разархиваторов не видел. Что-нибудь нормально раскрывает все сложенные комментарии, прежде чем сохранять? И,наверно, придётся вырезать рекламу.
vit_r: default (Default)

[personal profile] vit_r 2020-11-25 06:02 pm (UTC)(link)
В принципе, интересные дискуссии стоит сохранять руками, потому что можно вырезать лишнее и соединить логически то, что всплывает в разных темах. Но это делал только в процессе чтения и только по некоторым вопросам.
balu: (Gene Kranz Луна - она вот там)

[personal profile] balu 2020-11-25 06:04 pm (UTC)(link)

Наразі, я й сам щось таке роблю. Крім того, гіт[хл]аб підтримує публікацію сторінок за допомогою мегарульозного Jekyll. Ось приклад або, взагалі, їх збірка

Edited 2020-11-25 18:07 (UTC)
dmm: (Default)

[personal profile] dmm 2020-11-25 06:04 pm (UTC)(link)
Ну да, если руками, то заодно и читаешь/обрабатываешь - это более плодотворно...

[personal profile] anonim_legion 2020-11-25 06:05 pm (UTC)(link)
Давно пора. Только с гитхаба и снести могут, лучше ещё и в других местах держать

[personal profile] anonim_legion 2020-11-25 06:06 pm (UTC)(link)
А вы часом не встречали такого продукта, нечто вроде локального прокси для браузера, чтобы он хранил всё просмотренное и строил индекс для поиска по нему?
balu: (Gene Kranz. Запарка.)

[personal profile] balu 2020-11-25 06:08 pm (UTC)(link)
Налаштувати автоматичну синхронізацію з гітлабом, соурсфоржет і т.і.
vit_r: default (Default)

[personal profile] vit_r 2020-11-25 06:11 pm (UTC)(link)
Месье хочет поговорить про семантический поиск?

[personal profile] anonim_legion 2020-11-25 06:20 pm (UTC)(link)
Нет, я о гораздо более простой вещи. Локальный HTTP-прокси для браузера и обычный поиск с учётом морфологии.

Для семантического поиска нужно не знаю что, полный word2vec для каждого языка отдельно, и к нему непонятно какой индекс для просмотренного.
chuka_lis: (Default)

[personal profile] chuka_lis 2020-11-25 06:44 pm (UTC)(link)
интересная идея.
Edited 2020-11-25 18:45 (UTC)
vit_r: default (Default)

[personal profile] vit_r 2020-11-25 07:08 pm (UTC)(link)
Для семантического поиска нужно размечать текст ручками. Особенно в диалогах, где все правила логики и грамматики нарушаются.
balu: (Gene Kranz Луна - она вот там)

[personal profile] balu 2020-11-25 07:57 pm (UTC)(link)

У jekyll майже все й пишеться са́ме в md. Я, правда, використовую org з конвертацією в md.

proben: (Default)

[personal profile] proben 2020-11-25 09:44 pm (UTC)(link)
К инсталляции вордпреса была примочка для полного скачивая жж через из их api. Помню скачивал журналы себе локально, правда багу пришлось пофиксить у них. Но это было сто лет тому. По-идее, у дрима api должен был сохраниться как в оригинальном жж.

[personal profile] kostyad 2020-11-25 10:20 pm (UTC)(link)
по глупости не скринил, а удалял комм в жж когда меня оскорбляли или угрожали
gingema: (Default)

[personal profile] gingema 2020-11-25 11:58 pm (UTC)(link)
А почему в гитхаб? Или это профессиональные журналы?
rampitec: (Default)

[personal profile] rampitec 2020-11-26 12:27 am (UTC)(link)
У тебя же есть свой хостинг? Ты можешь устроить там гит и вообще ни от кого не зависеть.

Я конечно не держу под VC всякие бэкапы, в голову не приходило, но для своих собственных исходников держу свой mercurial сервер. Хорошо, когда он свой.
alexanderr: (Default)

[personal profile] alexanderr 2020-11-26 03:25 am (UTC)(link)

а откуда известно, что гитхаб "никуда не денется"??
это Bill Gates обещал? зуб давал?

и вообще у микрософта track record вроде безукоризненный,
со всеми приобретениями. как он что купит, так и оставляет
сразу в покое. и оно никуда не девается

hotmail
webTV
visio
skype
linkedin

там бесконечный список

https://en.wikipedia.org/wiki/List_of_mergers_and_acquisitions_by_Microsoft
stas: (Default)

[personal profile] stas 2020-11-26 04:01 am (UTC)(link)
Бэкап - идея хорошая, а вот использовать для этого микрософт - не уверен, что да.
balu: (Gene Kranz. Запарка.)

[personal profile] balu 2020-11-26 06:45 am (UTC)(link)
gitlab, bitbucket, sourceforge

[personal profile] vap 2020-11-26 10:12 am (UTC)(link)
Ну так никто же не мешает иметь и то, и другое, и даже что-нибудь третье, и еще локальную копию (или не одну - на разных дисках в разных местах), и периодически просто делать pull из одной копии в другую. Это ж git.
scaredy_cat_333: (Default)

[personal profile] scaredy_cat_333 2020-11-26 04:28 pm (UTC)(link)
Многие так не думают, а мне кажется - совсем обыденная мысль. Интернета скоро не будет. Почти все, что в нем сейчас размещено, совсем скоро, пары десятков лет не пройдет, будет на прежнем месте уже не найти. Обычно - и ни в каком другом месте. Или совсем не так легко и дешево. Всех этих разговоров, содержания сайтов, статей, книг, фильмов и музыки - всего. Одни облака развеются, другие отяжелеют дороговизной. Торренты попересохнут. В интернете, говорят, сохраняется все - я думаю, если что-то и сохраняется, но совсем не нами, и не для нас. Не нужно рассчитывать на других.
https://bouzyges.livejournal.com/377650.html


Долго избегал класть что-нибудь в Google Photoes, поскольку - знаем мы этот Гугль, наконец понадобилось на пару фоточек сделать внешнюю ссылку - и залез. Тут же, собаки, сделали платным - и недели не прошло. Не очень то и хотелось, но реакция впечатляет.

Так то у меня все на домашнем клауде сидит и даже извне туда можно с телефона складывать. Наверное, можно и расшаривать - и вселенной сложно придётся, чтобы это остановить. Интернет придётся вырубать, вместе с электричеством.
scaredy_cat_333: (Default)

[personal profile] scaredy_cat_333 2020-11-26 04:32 pm (UTC)(link)
А нужна какая-то специальная примочка? Помнится, когда я не смог найти свой особо мудрый комментарий в чужом жж - я скачал весь этот жж совершенно стандартным тулзом. И таки нашёл.
notabler: (Default)

[personal profile] notabler 2020-11-28 04:21 am (UTC)(link)
Как можно скопировать весь чужой ЖЖ? Подскажите, мне очень нужно, а я профанка старая. Журналы моего покойного брата, на всякий случай. Они мемориальные, но все же...
moscowfix: (Default)

[personal profile] moscowfix 2020-11-29 05:25 pm (UTC)(link)
Странно, все стали обсуждать технические подробности, но никто не поинтересовался, что за журналы.
scaredy_cat_333: (Default)

[personal profile] scaredy_cat_333 2021-02-16 09:05 pm (UTC)(link)
Я прошу прощения - только сейчас обнаружил ваш вопрос, поскольку только сейчас обнаружил, куда мне гмейл коменты складывает.

Я не помню, к сожалению, имени тулза. Их, скачивающих весь сайт целиком - много. Но для успеха с ж нужно, чтобы настройками тулза можно было все нужное - оставить, а все ненужное - отрезать. А то вместе с комментариями потянутся и другие жж, а их не надо.

Я попробую найти у себя что был за прибор и пример настройки, но не обещаю.