Reverse-engineering d’application Flex
Publié le 23 juillet 2012

Tout récemment, j’ai eu à auditer un jeu en ligne pour un client, et je m’attendai à un jeu super travaillé qui repose sur des standards connus (un jeu en HTML5/CSS3/JS comme l’excellent CutTheRope). Mais non, je me suis retrouvé face à un jeu basé sur Flash et la technologie Flex. Si vous êtes un lecteur régulier de ce blog, vous devez savoir que les applications Flash ne me rebuttent pas, bien au contraire !

La prise en main du jeu est simple, mais le dialogue avec le serveur de jeu reste très obscur (car il s’agit d’un MEUPORG, bien sûr). D’après les captures effectuées, les données respectent le format Action Message Format (AMF) défini par Adobe, j’y avais déjà touché à l’époque des débuts de Deezer mais je suis loin d’en être un grand fan. Après de plus amples recherches, j’ai découvert qu’il s’agissait d’une application Flex, dialoguant avec plusieurs serveurs de jeu via de l’AMFRPC, un protocole activement employé par Flex. J’ai donc du m’équiper.

1. Outillage

Pour analyser des applications Flash, rien de mieux qu’un décompilateur Flash de renom. Pour ma part, je n’utilise pas Flare car incompatible avec les dernières versions de Flash, mais son pendant payant et pour Windows SWFDecompiler de Sothink. Cet outil reste LA référence dans le domaine, et permet de désassembler (presque) toutes les applications Flash. A cela s’ajoute la suite SWFTOOLS, bien pratique pour extraire des informations d’applications Flash (des ressources notamment).

Pour le proxy web, j’ai opté pour Charles Web Proxy. Il s’agit encore une fois d’un outil pour Windows, mais vu que de toute façon j’utilise déjà SWFDecompiler ... Charles Web Proxy permet de faire ce que tout bon proxy web transparent doit normalement savoir faire : espionner les requêtes, autoriser des points d’arrêt et surtout être capable de décoder et d’encoder les données selon plusieurs formats, dont l’AMF. On pourrait aussi employer Burp, qui possède la même fonctionnalité.

Pour terminer, la bibliothèque Python PyAMF permet de coder rapidement des clients AMFRPC en Python, très pratique dans notre cas.

Muni de ces outils, il est alors aisé d’intercepter les appels AMFRPC, de les analyser et de comprendre le fonctionnement global du service distant.

2. Flex, services et méthodes

Les applications Flex reposent sur des endpoints dans lesquels des services sont exposés, qui implémentent des méthodes que l’application Flash peut appeler à distance. Il s’agit ici de ce qu’on appelle couramment un système d’appel de procédure distante, ou Remote Procedure Call (RPC). Ce système de service est très courant, et permet d’offrir plusieurs services sur un seul point de connexion (ou endpoint.

Du point de vue d’un pentester, un service Flex est une grosse boîte noire possédant des services qui implémentent des méthodes, qu’il va falloir découvrir. Pour cela, plusieurs solutions sont envisageables :

Le dernier point est un peu plus ardu, car nécessite le développement d’un client AMFRPC dédié. Les deux premières méthodes sont donc préférables. J’ai ainsi débuté mon analyse par une décompilation du fichier SWF contenant le coeur de l’application. Et les ennuis ont commencés : SWFDecompiler plante lâchement durant l’analyse, et impossible donc d’obtenir le code de l’application. J’ai fait de nombreuses tentatives, avec différents logiciels, sans succès. Il semblerait que SWFDecompiler ait montré ses limites. Cela signifie-t-il qu’il est impossible d’extraire quoique ce soit de ce fichier ? Que nenni (© Tixlegeek)

2.1. Flasm + strings + grep = FTW (plan B)

N’ayant pas la possibilité de désassembler l’application, le plan B consiste à extraire directement du fichier les chaînes de caractères et à essayer de déduire les services des informations s’y trouvant. Avant toute chose, on fait appel à la commande file pour identifier le type d’application :

$ file ZOMFG.swf
ZOMFG.swf: Macromedia Flash data (compressed), version 10

Il s’agit d’une application Flash />=10 compressée. Autrement dit, rien ne sert de grepper directement le contenu du fichier, c’est compressé. Il nous faut donc décompresser ce fichier, grâce à flasm :

$ flasm -x ZOMFG.swf
ZOMFG.swf successfully decompressed, 7958828 bytes
$ file ZOMFG.swf
ZOMFG.swf: Macromedia Flash data, version 10

Il est ensuite trivial d’extraire les chaînes de caractères avec strings, et de grepper le résultat à la recherche d’éléments intéressants :

$ strings ZOMFG.swf > ZOMFG.txt
$ grep ZOMFG.txt -e "some keywords here"

Il est aussi possible d’utiliser vim et ses recherches par motif, ou autre.

2.2. Analyse de flux

L’analyse de flux est relativement simple à réaliser grâce à Charles Web Proxy : celui-ci parse vraiment bien les messages AMF mais n’affiche pas tout (comme par exemple certaines listes), cependant cela reste un compagnon de choix ! Cette analyse de flux permet de mettre à jour un certain nombres de services, ainsi que de méthodes.

Il suffit d’utiliser l’application, et de noter les différents services et les méthodes associées. De plus, il peut être intéressant de repérer les différents messages et les champs associés, afin d’envisager des attaques par rejeu par la suite.

Le champ destination contient la référence au service, ici appelé "SMC". Le champ operation décrit la méthode à appeler, en l’occurrence "ExecuteServerCall".

2.3. Enumération des services et des méthodes associées

Cette dernière possibilité repose sur les résultats produits par les deux étapes précédentes : à l’aide de la première analyse, on établit une liste potentielle de services et de noms de méthodes, puis à l’aide d’un client AMFRPC maison, on teste la validité des services puis on détermine les méthodes existantes à partir des services identifiés.

Cette technique permet de déterminer de manière plus efficace les services et les méthodes associées, et permet de trouver dans certains cas des éléments non-présents dans l’application. J’ai développé dans le cadre de ce test d’application un outil semblable à DeBlaze, mais permettant de tester un service Flex distant (et aussi beaucoup moins poussé). Cet outil repose sur la bibliothèque Python PyAMF, et tente de déterminer les services offerts par un endpoint donné. Cela suppose que l’on connaisse le nom de cet endpoint, qui peut être trouvé via les deux méthodes précédentes.

Je ne peux pas dévoiler le code source de cet outil dans ce post (ooooh !), car il est soumis à des règles relativement strictes de confidentialité, propres à Sysdream. Cependant, l’algorithme de base est le suivant (aaaah !) :

Pour chaque nom de service probable:
   resultat = tenter un appel à la méthode Trololololo
   Si pas d'erreur d'invocation:
       Affiche 'Service: ' + service
       Pour chaque méthode probable:
           resultat =appeler  la méthode 'methode' du service
           Si aucune erreur d'invocation ni message de méthode non trouvée:
                 Affiche '- Methode:' + methode

De cette manière, on teste l’ensemble des services possibles et des méthodes probables. On peut aussi envisager des combinaisons de nom, des changement de casse, etc ... A noter que la référence à l’endpoint est obligatoire dans les headers Flex.

3. Sessions Flex

Lors de mes tests, j’ai été rapidement rejeté par le service Flex à cause des sessions. En effet, les applications Flex font appel à une gestion de session en Java (donc un cookie JSESSIONID par défaut), et il faut gérer ce cookie dans le client AMF pour pouvoir maintenir une session correcte. De même, l’envoi des requêtes via des "messages" AMF est basé sur une numérotation qui est continuellement incrémentée. Celle-ci doit aussi être maintenue par notre client AMF.

Lors des tests, et tout particulièrement lors des tests fonctionnels, les sessions sont primordiales et bien souvent mises de côté par les outils qui ne font pour la plupart que des tests unitaires. Ce qui impose dans bien des cas l’implémentation d’un client Flex maison prenant en charge ces sessions, quand il n’y a pas d’autres éléments de cookie à prendre en compte, bien sûr.

4. Conclusion

Les tests d’applications Flex se rapprochent fortement des tests de services web, car au fond le système Flex n’est rien d’autre qu’un service web basé sur AMF (au lieu des services SOAP que l’on retrouve souvent). Sans les possibilités de découverte des services et méthodes offertes par WSDL. Je pense avoir fait le tour des principaux soucis rencontrés durant le test de ce type d’application, même si le cas évoqué ici était un brin récalcitrant. D’ailleurs à ce jour, je n’ai pas trouvé de logiciel de décompilation permettant de décompiler ce satané SWF. Si quelqu’un a une idée (ou une révélation divine), me contacter via twitter ou via gmail.