WTF is this manual? – Telegram
WTF is this manual?
27 subscribers
174 photos
40 videos
78 files
690 links
Obscure IT and graphs of...what?
Download Telegram
book of proof Hammack.pdf
1.8 MB
Easter egg: it this book you can find Putin
Forwarded from Open Source
​​Awesome OSS Monetization

Кураторский список потрясающих подходов к монетизации программного обеспечения с открытым исходным кодом.

Этот список является результатом обширного интернет-исследования. Список разбит на категории на основе концепции, за которую платит плательщик.

Обратите внимание, что список, классификация и терминология представляют собой субъективное мнение по этому вопросу.

https://github.com/PayDevs/awesome-oss-monetization
Forwarded from Denis Sexy IT 🤖
Media is too big
VIEW IN TELEGRAM
Меня продолжает не отпускать от локальных больших языковых моделей:

Запустил для теста модель на 13 миллиардов параметров, весом ~7 Гб, которая работает на GPU мака с простеньким ARM-процессором M1, 16 Гб RAM и 256 Гб жесткого диска.

Просто посмотрите на скорость этой «ChatGPT» дома которая работает без интернета. Это становится каким-то странным хобби, потому что мне просто приятно иметь у себя на переносном девайсе многие знания мира в виде одного файла, и я постоянно тестирую новые модели что выходят.

И самое главное, что уже через месяц, это будет работать еще быстрее, а с таким прогрессом, к моменту когда очки от Apple выйдут, уже можно будет себе построить полноценный переносной SciFi-в-шлеме, где мультимодальная нейронная модель работающая прямо на устройстве, будет и описывать текстом, что перед пользователем видит, и если нужно, давать советы. Все как в играх короче.

Для техногиков:
– Модель WizardLM-13B q4_0
– llama.cpp скомпилированная для поддержки Metal (LLAMA_METAL=1 make -j и -ngl 1 во время запуска).
Cool-retro-term для красивого терминала в ретро-стиле.
Forwarded from partially unsupervised
Я уже недавно писал, что в эпоху LLM регулярки снова стали актуальным инструментом так называемого AI. Regex-in-the-loop как промежуточный вариант между "слепо доверимся черному ящику" и относительно дорогим human-in-the-loop.

И вот для тех, кто уже перешел с ChatGPT на что-то опенсорсное из зоопарка парнокопытных, уже появился враппер, который заставляет LLM-ку отвечать в заданном формате. Идея очень простая:

ReLLM filters non-matching tokens pre-generation. For each token, ReLLM tests every possible completion against a partial regex. For the potential completions that do not match the pattern, ReLLM masks the logits so that the language model does not generate them.

У меня нет бенчмарков, потому голословно выскажу предположение, что для ряда нехитрых продакшен задач такой нехитрый костыль сильно сократит отставание опенсорсных LLM от великого и могучего OpenAI.
Хотите посмотреть на крутейшую коллекцию txt-файлов 1960-1980 годов?

Всего файлов примерно 60 тысяч, и весят они больше гигабайта (!!!). Что в файлах? Главным образом это архивы BBS-ок (bulletin board system, чисто текстовый протокол связи, который использовался до веба и параллельно ему) 1982-1996 годов. Если вам когда-нибудь хотелось посмотреть на то, что это за такая "свобода" интернетов, которую мы потеряли, вам сюда (и желательно через тор): тут и пираты, и хакеры, и криптоанархисты, и просто анархисты разной степени деструктивности и политической сознательности. Среди тем - хакерство, оккультное, вепщества, политика, наука и не вполне наука, научная фантастика, всяческое выживалие, теории заговора, НЛО, вирусы, сексуальность, телефонный фрикинг. Отдельная директория отведена под полные архивы отдельных BBS-ок.

Речь идёт не только о .txt, но о любых ascii-файлах, которые бережно собирает замечательный энтузиаст-архивист Джейсон Скотт с дискет, магнитных лент, дисков и других носителей. Файлы могут быть довольно экзотичных расширений (.nfo, .box, .ght, .01) или не иметь их вовсе, но в целом всё читается обычным блокнотом.

Если у вас хороший браузер, он будет ругаться: сайт Скотта работает на http (без заветной буковки s), но это не страшно, потому что это good old static web. Никаких куки, никакого интерактива, никаких данных от пользователей, голый html-2.

По какой-то загадочной причине хочется прислать вам ссылку не на оригинал, а на зеркало: https://textfiles.vistech.net/
👍1
Forwarded from GitHub Community
OCRmyPDFинструмент, что конвертирует обычный PDF в доступный для поиска файл, добавляя текстовый слой OCR к отсканированным PDF-файлам

Это позволяет выполнять их поиск по тексту или копирование и вставку

Ссылка на проект

GitHub | #Interesting #Useful
Forwarded from Open Source
This media is not supported in your browser
VIEW IN TELEGRAM
Video-LLaMA

Аудиовизуальная языковая модель ИИ, настроенная для понимания видео.

https://github.com/DAMO-NLP-SG/Video-LLaMA
Forwarded from akater
В тему: я сюда еще не писал, что релизнул билд-систему, которой сопровождаю свои пакеты, написанные в Орге.

Она и сама себя почти полностью билдит, я прям доволен.

Хотя в основном она мне нужна как нечто минималистичное, чтоб ею уже устанавливать настоящую билд-систему, но (1) это когда еще будет (2) некоторые люди вот собирают части своего конфига из Орга, и я подумал, может, им полезно будет.  Мне никогда не казалась хорошей идея танглить инит из одного-единственного орг-файла, но вот танглить из базы знаний в виде кучи орг-файлов — это осмысленнее.

Так что вот: fakemake. Если че-то непонятно написано в начале, жду замечаний. Ссылка верная, но м.б. недоступна в некоторых частях мира.
Forwarded from GitHub Community
Spyglassинструмент личной поисковой системы, которая индексирует то, что вам нужно, предоставляя вам информацию в простом и быстром интерфейсе

Позволяет пользователям сканировать и индексировать локальные документы/папки, различные интернет-темы, документы Google Диска, репозитории GitHub, сохраненные/проголосованные посты Reddit, Gmail, и многое другое

Ссылка на проект

GitHub | #Interesting #Search
Forwarded from Open Source
​​Black Hat Python

Код и упражнения из книги «Black Hat Python: программирование на Python для хакеров и пентестеров» прошедший рефакторинг и переписанный на Python 3

Книга является важной вехой для пентестинга с Python и получила положительные отзывы по всему миру.

Исходный код и упражнения из книги, охватывают такие темы как основы работы в сети, инструменты сниффинга, Scapy и ARP, интеграция Burp Suite, вредоносы для ОС Windows и многое другое...

https://github.com/carloocchiena/blackhat_python_book_code
Forwarded from GitHub Community
GPT Engineerинструмент на основе GPT OpenAI, который генерирует целые большие кодовые базы на основе запроса пользователя

Пользователи могут указать, что желают сделать благодаря ИИ, а инструмент будет задавать вопросы, уточняя все тонкости перед генерацией кода

Ссылка на проект

GitHub | #Interesting #AI