juan_gandhi: (Default)
[personal profile] juan_gandhi
Есть сильное желание бекапнуть и засунуть в гитхаб некоторые журналы из жж - прямо с дискуссиями. Чтоб сохранялось вообще. А то мало ли. 

Date: 2020-11-25 05:17 pm (UTC)
fizzik: (Default)
From: [personal profile] fizzik
Хорошая идея.

Date: 2020-11-25 05:34 pm (UTC)
From: [personal profile] zaharchenko
А почему именно гитхаб для бэкапов ?

Date: 2020-11-26 03:25 am (UTC)
alexanderr: (Default)
From: [personal profile] alexanderr

а откуда известно, что гитхаб "никуда не денется"??
это Bill Gates обещал? зуб давал?

и вообще у микрософта track record вроде безукоризненный,
со всеми приобретениями. как он что купит, так и оставляет
сразу в покое. и оно никуда не девается

hotmail
webTV
visio
skype
linkedin

там бесконечный список

https://en.wikipedia.org/wiki/List_of_mergers_and_acquisitions_by_Microsoft

Date: 2020-11-25 05:56 pm (UTC)
dmm: (Default)
From: [personal profile] dmm
Это правда. Но руками, всё таки, сложно...

Date: 2020-11-25 06:02 pm (UTC)
vit_r: default (Default)
From: [personal profile] vit_r
В принципе, интересные дискуссии стоит сохранять руками, потому что можно вырезать лишнее и соединить логически то, что всплывает в разных темах. Но это делал только в процессе чтения и только по некоторым вопросам.

Date: 2020-11-25 06:04 pm (UTC)
dmm: (Default)
From: [personal profile] dmm
Ну да, если руками, то заодно и читаешь/обрабатываешь - это более плодотворно...

Date: 2020-11-25 06:06 pm (UTC)
From: [personal profile] anonim_legion
А вы часом не встречали такого продукта, нечто вроде локального прокси для браузера, чтобы он хранил всё просмотренное и строил индекс для поиска по нему?

Date: 2020-11-25 06:11 pm (UTC)
vit_r: default (Default)
From: [personal profile] vit_r
Месье хочет поговорить про семантический поиск?

Date: 2020-11-25 06:20 pm (UTC)
From: [personal profile] anonim_legion
Нет, я о гораздо более простой вещи. Локальный HTTP-прокси для браузера и обычный поиск с учётом морфологии.

Для семантического поиска нужно не знаю что, полный word2vec для каждого языка отдельно, и к нему непонятно какой индекс для просмотренного.

Date: 2020-11-25 07:08 pm (UTC)
vit_r: default (Default)
From: [personal profile] vit_r
Для семантического поиска нужно размечать текст ручками. Особенно в диалогах, где все правила логики и грамматики нарушаются.

Date: 2020-11-25 06:00 pm (UTC)
vit_r: default (Default)
From: [personal profile] vit_r
Архиваторы видел, разархиваторов не видел. Что-нибудь нормально раскрывает все сложенные комментарии, прежде чем сохранять? И,наверно, придётся вырезать рекламу.

Date: 2020-11-25 06:04 pm (UTC)
balu: (Gene Kranz Луна - она вот там)
From: [personal profile] balu

Наразі, я й сам щось таке роблю. Крім того, гіт[хл]аб підтримує публікацію сторінок за допомогою мегарульозного Jekyll. Ось приклад або, взагалі, їх збірка

Edited Date: 2020-11-25 06:07 pm (UTC)

Date: 2020-11-25 07:57 pm (UTC)
balu: (Gene Kranz Луна - она вот там)
From: [personal profile] balu

У jekyll майже все й пишеться са́ме в md. Я, правда, використовую org з конвертацією в md.

Date: 2020-11-25 06:05 pm (UTC)
From: [personal profile] anonim_legion
Давно пора. Только с гитхаба и снести могут, лучше ещё и в других местах держать

Date: 2020-11-25 06:08 pm (UTC)
balu: (Gene Kranz. Запарка.)
From: [personal profile] balu
Налаштувати автоматичну синхронізацію з гітлабом, соурсфоржет і т.і.

Date: 2020-11-25 06:44 pm (UTC)
chuka_lis: (Default)
From: [personal profile] chuka_lis
интересная идея.
Edited Date: 2020-11-25 06:45 pm (UTC)

Date: 2020-11-25 09:44 pm (UTC)
proben: (Default)
From: [personal profile] proben
К инсталляции вордпреса была примочка для полного скачивая жж через из их api. Помню скачивал журналы себе локально, правда багу пришлось пофиксить у них. Но это было сто лет тому. По-идее, у дрима api должен был сохраниться как в оригинальном жж.

Date: 2020-11-26 04:32 pm (UTC)
scaredy_cat_333: (Default)
From: [personal profile] scaredy_cat_333
А нужна какая-то специальная примочка? Помнится, когда я не смог найти свой особо мудрый комментарий в чужом жж - я скачал весь этот жж совершенно стандартным тулзом. И таки нашёл.

Date: 2020-11-28 04:21 am (UTC)
notabler: (Default)
From: [personal profile] notabler
Как можно скопировать весь чужой ЖЖ? Подскажите, мне очень нужно, а я профанка старая. Журналы моего покойного брата, на всякий случай. Они мемориальные, но все же...

Date: 2021-02-16 09:05 pm (UTC)
scaredy_cat_333: (Default)
From: [personal profile] scaredy_cat_333
Я прошу прощения - только сейчас обнаружил ваш вопрос, поскольку только сейчас обнаружил, куда мне гмейл коменты складывает.

Я не помню, к сожалению, имени тулза. Их, скачивающих весь сайт целиком - много. Но для успеха с ж нужно, чтобы настройками тулза можно было все нужное - оставить, а все ненужное - отрезать. А то вместе с комментариями потянутся и другие жж, а их не надо.

Я попробую найти у себя что был за прибор и пример настройки, но не обещаю.

Date: 2020-11-25 10:20 pm (UTC)
From: [personal profile] kostyad
по глупости не скринил, а удалял комм в жж когда меня оскорбляли или угрожали

Date: 2020-11-25 11:58 pm (UTC)
gingema: (Default)
From: [personal profile] gingema
А почему в гитхаб? Или это профессиональные журналы?

Date: 2020-11-26 12:27 am (UTC)
rampitec: (Default)
From: [personal profile] rampitec
У тебя же есть свой хостинг? Ты можешь устроить там гит и вообще ни от кого не зависеть.

Я конечно не держу под VC всякие бэкапы, в голову не приходило, но для своих собственных исходников держу свой mercurial сервер. Хорошо, когда он свой.

Date: 2020-11-26 10:12 am (UTC)
From: [personal profile] vap
Ну так никто же не мешает иметь и то, и другое, и даже что-нибудь третье, и еще локальную копию (или не одну - на разных дисках в разных местах), и периодически просто делать pull из одной копии в другую. Это ж git.

Date: 2020-11-26 04:01 am (UTC)
stas: (Default)
From: [personal profile] stas
Бэкап - идея хорошая, а вот использовать для этого микрософт - не уверен, что да.

Date: 2020-11-26 06:45 am (UTC)
balu: (Gene Kranz. Запарка.)
From: [personal profile] balu
gitlab, bitbucket, sourceforge

Date: 2020-11-26 04:28 pm (UTC)
scaredy_cat_333: (Default)
From: [personal profile] scaredy_cat_333
Многие так не думают, а мне кажется - совсем обыденная мысль. Интернета скоро не будет. Почти все, что в нем сейчас размещено, совсем скоро, пары десятков лет не пройдет, будет на прежнем месте уже не найти. Обычно - и ни в каком другом месте. Или совсем не так легко и дешево. Всех этих разговоров, содержания сайтов, статей, книг, фильмов и музыки - всего. Одни облака развеются, другие отяжелеют дороговизной. Торренты попересохнут. В интернете, говорят, сохраняется все - я думаю, если что-то и сохраняется, но совсем не нами, и не для нас. Не нужно рассчитывать на других.
https://bouzyges.livejournal.com/377650.html


Долго избегал класть что-нибудь в Google Photoes, поскольку - знаем мы этот Гугль, наконец понадобилось на пару фоточек сделать внешнюю ссылку - и залез. Тут же, собаки, сделали платным - и недели не прошло. Не очень то и хотелось, но реакция впечатляет.

Так то у меня все на домашнем клауде сидит и даже извне туда можно с телефона складывать. Наверное, можно и расшаривать - и вселенной сложно придётся, чтобы это остановить. Интернет придётся вырубать, вместе с электричеством.

Date: 2020-11-29 05:25 pm (UTC)
moscowfix: (Default)
From: [personal profile] moscowfix
Странно, все стали обсуждать технические подробности, но никто не поинтересовался, что за журналы.

Profile

juan_gandhi: (Default)
Juan-Carlos Gandhi

June 2025

S M T W T F S
1 2345 6 7
891011121314
15161718192021
22232425262728
2930     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 9th, 2025 05:11 am
Powered by Dreamwidth Studios