01/16/11 19:46
(http://delian.blogspot.com)

Може ли да се установи дали СРС-тата на Танов са минали през GSM мрежата на оператор

След една дискусия, инициирана от скандалите за СРС-та се отвори една интересна тема - дали има механизъм за лесно установяване за това, дали СРС записите са записани от оборудване на МВР или от друго място. Въпреки че министър Цветанов веднага се опита да прехвърли вината на мобилните оператори, косвените показатели, че става въпрос за издънки някъде в службите за момента са драматично преобладаващи (включително факта, че Танов е знаел, че е подслушван). Обаче започнаха да се появяват и твърдения, че може записите да са направени с външни устройства, имайки се в предвид, че се чуват звуци от преди звъненето в новите записи. Аз обаче смятам, че това не може да е показател, тъй като по това те се различават от първите записи, и може вторите да са обработени нарочно, поради изказването на прокуратурата, че техните "експерти" казват, че щом записа е цифров, нямало начин да не се установил първоизточник. Аз първосигнално след такова изказване, бих прекарал записа през аналогов спиикър-микрофон, и подозирам, че подобно поведение е имал и "заинтересованият гражданин" на Явор Дачков, ако разбира се приемем, че това не е второто му аз. Други причини също съществуват, особено ако комуникацията е 2G (там звуковият канал се изгражда преди вдигането на отсрещната страна, но това би било изключителен индикатор за оборудване участващо в SS7 сигнализацията на оператора и имащо достъп дори до media-announce съобщенията - почти 100% индикатор за произход от оборудването на МВР). 
Та появи се дискусията, дали не може все пак въпреки този презапис да е останала неоспорима следа, от това дали записа е правен през мобилната мрежа на оператора (и следователно най-вероятно от оборудването на МВР) или от софтуер на телефона или от външно оборудване до подслушваният субект.
Моята теза е, че всъщност установяването на това може да се окаже удивително изпълнимо, по наличните в интернет презаписи, въпреки всички транскодинги, които им са се случили и дори прекарването им през аналогов микрофон. Нещо повече, с провеждането на експеримент е вероятно възможно и да се установи дали тази мрежа е била на Мобилтел, Глобул или Вивател.
Ето на какво е базирано моето предположение -
Ако записа е правен със софтуер на телефон или с устройство с микрофон в близост до Танов, едната от страните (Танов) трябва да се чува по естествено, честотната лента на разговора в посоката трябва да е по-динамична, средната мощност на звука по-голяма и това може веднага да се установи на честотната диаграма на записа. Ако е минало през мобилната мрежа, двете страни ще са относително нормализирани и това също би било лесно видимо на диаграмата.

Но аз имам и друго в предвид. Мобилните мрежи използват кодеци, които не са особено популярни в реалният живот и не се ползват от диктофони и друго оборудване. Причината за това е, че съотношението им на процесорни цикли/bandwidth е обикновено лошо. В мобилната мрежа цената на процесорните цикли обаче се пренебрегва в полза на bandwidth-а, докато при други приложения се търсят други съотношения.
Кодеците са GSM.13 за 2G и AMR 12.10 (AMR-NB) за 3G.
Разбира се, не искам да кажа, че записите по флашките на Дачков са с оригиналните си кодеци. Това би било глупаво. Отделно че дори в самата мобилна мрежа се извършва транскодинг от access codec-а към G.711alaw. Записите в Интернет вероятно са допълнително транкодвани при слагането им в VBOX7 например.

Но моята теза е, че всеки кодек и транскодинг остава следа, от която могат да се създадат маркери, по които този кодек да се открие. И въпреки транскодингите и преминавания през аналогови презаписи, тези маркери могат да бъдат открити в голяма степен. Нещо повече, подобни маркери оставят и echo cancellation устройствата, маркери, които се натрупват и по тях индикативно може да се установи къде спрямо структурата на мобилният оператор е извършено подслушването (тъй като в мрежите може да има няколко канцелатора и транскодинга). По това може да се установи с различна степен на достоверност дали е записа правен през мобилен оператор, кой евентуално оператор, позиция, и по този начин вероятно индикативно да покаже, дали записа е правен с оборудването на МВР.

За направата на този анализ е необходим евентуално по-качествен запис от говора на Танов, за да служи като контролен. Но това не е проблем. Може да се вземе от телевизор, директно интервю или друго.

Тезата е базирана на следната идея -
Начина на кодиране на цифров звук е комбинация от честотно модулиране (sampling), запис на мощността на звука, и добавени филтрации/преобразувания с цел премахване на излишъка. Така се намалява количеството записвана информация. Премахваната информация променя звука, но често това става по незабележим за човек начин (честоти или звукови комбинации, които не се чуват, намаляване на разделителната способност на мощността на звука и т.н.).

Но техниката на всеки кодек е доста различна (освен при кодеците от един и същи род). Например G.711 намалява най-вече разделителната способност на мощността на звука, но има фиксиран линеен самплинг от 8khz. Други кодеци заглаждат звъци, намаляват и разделителната способност на самплингите динамично или статично (G.729), допълнително намаляване на динамиката на мощността. 

При транскодинг от един кодек на друг тези техники не изчезват а се наслагват. Така както бихте наслагали една рисунка върху друга. В резултат специфичните маркери на даден кодек могат да се запазят, особено в по продължителни записи и да се открият.

Echo cancellation техниките използвани в мобилните мрежи също имат специфична характеристика. Тя е лесно уловима - вълната от едната посока се вижда инвертната от време на време в другата. Може да има изместване и наслагване на такива инвертвания, показател за повече от един канцелатор. Новите канцелатори пускат и бипове на някой специфични честоти (нечуваеми за човек), например 2100hz, за да замерват закъснения. Те също се наслагват.

Не съм звуков специалист определено, но мога да опиша алгоритъм по който да се установи дали такива маркери съществуват -
Взима се добър запис на Танов (по широка честотна лента, да речем 16khz), изчиства се шум (с low и high pass филтри над 8khz), нормализира се и се конвертира (със sox) до G.711alaw, AMR и GSM.13.
След това се правят следните конверсии - AMR->g.711а и GSM.13->g.711а.
Получените резултати се наслагват върху първата g.711 и се прави изключващо или. Там където мощностите съвпадат се слага черно, където се различават - бяло (за разликата).
Белият цвят ще бъде честотният спектър изрязан от GSM.13 и AMR. Това е маркера, който ще се търси (по изрязване) в записите на Танов (предварително нормализирани и с изчистен шум - noise cancellation филтър приложен) за индикиране, дали тези кодеци са присъствали по време на записа. Ако предимно (на определени думи или комбинация гласна-съгласна, да речем срички)  този маркер липсва, то имаме доказателство за присъствието на този кодек в пътя на транскодинга. Ако този маркер предимно присъства, значи този кодек не го е имало.

Подобна операция се извършва и по динамиката на мощностите на звука (може да се ползват различни цветове при нарастването на мощността - като дъга, за да може отново да се види визуално).

Комбинацията - маркери за филтър + маркери за динамика за мощност, могат според мен с изключителна достоверност да определят дали кодека е присъствал.

Подобна, но макар и по компексна, техника може да се приложи за ехо канцелаторите. Тъй като core дизайна на мрежата на всеки оператор у нас се различава, това би могло индикативно да определи кой е оператора, къде е било подслушвателното оборудване (преди или след някой канцелатори), какво е било закъснението при което канцелаторите са филтрирали ехото, което би дало допълнителни индикации, които могат да покажат къде и как се е движил звуковият сигнал.

Всичката тази занимавка е просто тренировка на ума. Но дава механизъм на публиката да оцени колко я мотаят с публични изяви прокуратурата, министрите и т.н. и дали това, което говорят е вярно. Ако разполагате с Линукс и Audacity + sox и качествен запис на гласа на Танов, и свободно време, можете да тествате алгоритъма.

При все обстоятелства, трафичните данни биха дали относително безусловно доказателство дали е ползвано оборудването на МВР или не. Но това, която аз предлагам е индикативен механизъм, който може да го покаже и на базата само на информация налична в момента публично.

Ще ми бъде интересно да сравня резултатите от експертизата, която според мен може би се бави нарочно (може би за да паднат по давност трафичните данни?) и да го сравня със собствените си изводи.

П.С. Смятам че тази техника за откриване на пътя на разговора може да се усложни дори повече (от специалисти) и дори да може да разпознава групи от модели мобилни телефони използвани в разговора. Тъй като всеки мобилен телефон има различна комбинация от отстояние между спиикър и микрофон, има различен тип микрофон и спиикър, и различен софтуер, често с локален ехо канцелатор, то той би имал специфични характеристики видими в звуковата диаграма на аудио записите. Записи от външно оборудване няма да ги имат включени тези характеристики. Но ако записът е от мобилната мрежа, ще ги има.
Публикувана на 01/16/11 19:46 http://feedproxy.google.com/~r/delian/~3/TR0NMUcPUKk/gsm.html
Facebook TwitThis Google del.icio.us Digg Svejo Edno23 Email

Свързани новини:

новини от България
graphic
спортни новини
graphic

Бързи връзки


Търсене


Архив

RSS Абонамент

Новини от Грамофон

"Новини от Грамофон" - Следете последните новини от България и чужбина обединени на едно място. Обновяват се през 1 минута.

 

  •  

Ново: Публикуване