а как в нем добавлять в базу сигнатуры которые надо удалять в постах?? ну всякие там подпишись на наш ТГ, добавлять в фильтр рекламы разобрался как - /add_keyword (слово), а вот как пополнить бд сигнатур не выходит
UPD а лучше подскажи как в удаление гиперссылок добавить удаление трок с хештегами и @ (например "r/ #next" и "@(без_пробела)Membe чтобы просто в посте это снесло )
UPD2 тут вроде разобрался, наверное в functions.py дописать патерны
НО всё же как управлять keyword ? /add_keyword - добавить - а как удалить?)
За сигнатуры тут отвечает секция
def delete_signature(text, texts):
и как я понял ( с помощью чатажпт конечно же)
if count > 0.2 * total_lines: - это регулировка % повторяемости строк?
UPD а лучше подскажи как в удаление гиперссылок добавить удаление трок с хештегами и @ (например "r/ #next" и "@(без_пробела)Membe чтобы просто в посте это снесло )
UPD2 тут вроде разобрался, наверное в functions.py дописать патерны
Код:
def remove_links(text):
link_pattern = r'https?://[^\s]+|@\S+.*|#\S+.*'
result = re.sub(link_pattern, '', text)
return result
За сигнатуры тут отвечает секция
def delete_signature(text, texts):
и как я понял ( с помощью чатажпт конечно же)
if count > 0.2 * total_lines: - это регулировка % повторяемости строк?
Последнее редактирование: