Sepinf:Iped Sepinf:Iped: Índice Índice
Sepinf:Iped Sepinf:Iped: Índice Índice
Sepinf:Iped Sepinf:Iped: Índice Índice
SEPINF:IPED
De wiki
Índice
1 Indexador e Processador de Evidências Digitais
1.1 Descrição
1.2 Objetivos
1.3 Configuração
1.3.1 Relatórios do FTK 3+
1.3.2 Processamento de Imagens Forenses
1.3.3 Categorização
1.3.4 Detecção de Arquivos Criptografados
1.3.5 Expansão de Containers
1.3.6 Cálculo
Cálculo de múltiplos Hashes
1.3.7 Consulta a
Consulta a Base de Hashes (KFF)
1.3.8 Indexação
Indexação
1.3.9 OCR
1.3.10 Data Carving
Carving
1.3.10.1 K nnownMetCarving
ownMetCarving e KFFCarving
1.3.11 Miniaturas de Imagens
1.3.12 Miniaturas de Vídeos
1.3.13 Detecção de Imagens Explícitas (DIE)
1.3.144 Detecção de Idiomas
1.3.1
1.3.15 Expressões Regulares
1.3.16 Reconhecimento
Reconhecimento de Entidades Mencionadas
1.3.17 Pr oofiles
files de Processamento
1.3
1.3.17.1
.17.1 fastmode
1.3.17.2 forensic
forensic
1.3.17.3 pedo
1.3.17.4 blind
1.3.17.4 blind
1.3.18 Linux
Linux
1.3.199 DVD bootável com o IPED embutido
1.3.1
1.4 Utilização
1.4.1 Processamento
1.4.2 Análise
1.4.2.1 Filtros
1.4.2.2 Agrupamento por Metadados
1.4.2.3 Georreferenciamento de Imagens
1.4.2.4 Análise Global de múltiplos casos
1.4.2.5 Marcadores Automáticos para Itens Compartilhados
1.4.2.6 Localização de documentos por similaridade
1.4.2.7 Análise Simultânea ao Processamento
1.4.3 Extração de Arquivos de Interesse
1.4.3.1 Automática
1.4.3.2 Selecionados pelo Perito
1.4.3.3 Relatório HTML
1.5 Consumo de Memória e Performance
1.6 Considerações finais
Objetivos
Facilitar a visualização de Laudos de extração de dados por parte da equipe de investigação e melhorar a qualidade de Laudos contendo resultados de pesquisas por
palavras-chave.
Facilitar a análise dos dados em soluções de SARD, como a descrita em Triagem de Mídias SETEC/DF.
Ser uma alternativa aos softwares comerciais forenses na maioria dos casos periciais, por exemplo, em casos que necessitem de função de busca por palavras-chave ou
recuperação de dados apagados.
Configuração
O principal arquivo de configuração da ferramenta é o IPEDConfig.txt. Lá pode ser configurado o cálculo de hash, indexação do conteúdo dos arquivos
(indexFileContents), indexação do espaço não alocado (indexUnallocated), cálculo de assinatura (processFileSignatures), carving (enableCarving), expansão de
containers (expandContainers), dentre diversas outras opções comentadas no próprio arquivo. A seguir são detalhadas algumas configurações importantes.
https://wiki.ditec.pf.gov.br/SEPINF:IPED 1 /1 0
Relatórios do FTK 3+
Função específica para indexar relatórios do FTK para facilitar a revisão
r evisão de relatórios de extração de dados pelo solicitante do exame.
É necessário gerar o relatório utilizando o ID dos arquivos como nomenclatura e o IPED obtém as propriedades originais dos itens do banco de dados usando
seus IDs (caso seja de interesse, na busca o usuário pode exportar todos os arquivos com seus nomes originais).
Também é preciso editar o arquivo conf/FTKDatabaseConfig.txt ou fornecer os seguintes parâmetros na tela de preferências do indexador no AsAP 4.4+:
Banco de dados: Oracle, Postgres ou SQLServer
IP e porta do servidor de banco de dados
Nome da base de dados:
dados: FTK2 ou ADG
Versão do FTK: automático a partir do Indexador 2.9
Usuário e senha do banco de dados
Observe que este usuário é diferente do que você utiliza no FTK, portanto a senha provavelmente será diferente. No Oracle, para verificar se você sabe a senha, execute
"sqlplus" no prompt de comando e faça login como "sys as sysdba", no caso do Oracle.
No caso de a senha do usuário
usuário sys não ser conhecid
conhecida,
a, pode ser renomeado o arq
arquivo
uivo de senhas C:\Oracle\Product\10.2.0\AccessD
C:\Oracle\Product\10.2.0\AccessDataDB\database\PWDftk2.o
ataDB\database\PWDftk2.ora
ra e
gerado outro de mesmo nome com o utilitário orapwd, fornecendo a nova senha.
Categorização
A categorização dos arquivos é realizada principalmente via análise de assinatura pela biblioteca Apache Tika (http://tika.apache.org).
(http://tika.apache.org). A biblioteca retorna o mimeT
mimeType
ype
do arquivo, o qual é mapeado para uma categoria conforme configurado no arquivo
ar quivo conf/CategoriesByTypeConfig.txt.
conf/CategoriesByTypeConfig.txt.
Caso deseje definir um novo tipo (mimeType) de arquivo por assinatura, nome ou extensão, adicione a definição no arquivo conf/CustomSignatures.xml.
Além disso, a categoria dos arquivos pode ser refinada com base em qualquer propriedade, como caminho, tamanho, datas, deletado, etc. Para isso, utilize o arquivo
conf/CategoriesByPropsConfig.txt, o qual utiliza linguagem javascript para permitir flexibilidade nas definições.
conf/CategoriesByPropsConfig.txt,
Expansão de Containers
Para a expansão de containers, é utilizada a biblioteca Apache Tika (http://tika.apache.org), que fornece suporte para zip, tar, ar, arj, jar, gzip, bzip, bzip2, xz, 7z, z,
cpio, dump, formatos office, rtf e pdf. Caso se queira extrair imagens embutidas em PDFs, é necessário habilitar a opção processImagesInPDFs em
conf/AdvancedConfig.txt.
conf/AdvancedCon fig.txt. Além disso, a biblioteca foi estendida e foram implementados parsers para dbx, pst, ost, mbox, eml, rar, iso e edb. Entretanto, atualmente a
implementação tem a limitação de não recuperar emails apagados de dentro de dbx.
Para habilitar a expansão de containers, habilite o parâmetro expandContainers
expandContainers no arquivo IPEDConfig.txt. As categorias a serem expandidas podem ser alteradas no
arquivo conf/CategoriesToExpand.txt.
conf/CategoriesToExpand.txt. A expansão extrai os subitens para a pasta "subitens" e é recursiva, podendo utilizar espaço considerável. O hash dos arquivos é
usado como nomenclatura para economizar espaço.
Recomenda-se configurar uma pasta de saída (-o) do processamento num disco diferente daquele que contém as imagens/dados sendo processados,
processados, para minimizar
acessos concorrentes de leitura dos dados e escrita dos subitens expandidos.
https://wiki.ditec.pf.gov.br/SEPINF:IPED 2 /1 0
Indexação
Antes da indexação com a biblioteca Apache Lucene, é realizada a extração de texto dos arquivos com a biblioteca Apache Tika (http://tika.apache.org). Dentre os
formatos suportados, podem ser citados: MS Office (doc, docx, xls, xlsx, ppt, pptx e similares), OpenOffice (odt, ods, etc), Apple iWork (key
(key,, pages, numbers), PDF,
HTML e XML, RTF e TXT, e-mails (RFC822 e Outlook MSG) e metadados de audio (midi, mp3), imagens (bmp, jpg, psd, png, tif, etc) e vídeos (flv, mp4 e derivados
e ogg e derivados), dentre outros.
Além disso, foram criados parsers adicionais para MS Access, xBase, SQLite, Registro do Windows, atalhos LNK (PCF Gabriel), Known.met e ShareL/H.dat (PCF
8Wladimir),
e UTF-16 Library1/2.dat
utilizado comoefallBackParser
WhatsApp (PCF Pfeifer),
com todos osSkype (PCF
demais Patrick),
tipos bancos
de arquivo nãoEDB, históricos
suportados peloIndex.dat, alémbinários,
TIKA, como de um extrator de stringscorrompidos
desconhecidos, brutas ISO-8859-1,
e espaçoUTF-
não
alocado.
É possível habilitar/desabilitar parsers no arquivo conf/ParserConfig.xml, desabilitar a indexação de binários e desconhecidos (indexUnknownFiles)
(indexUnknownFiles) ou desligar a
indexação do espaço não alocado (indexUnallocated), o que pode ser interessante dependendo do volume de dados (como em casos de triagem de dados - SARD), pois
deixa o processamento mais rápido, resulta num índice muito menor e não apresenta hits de difícil interpretação em arquivos como pagefile, system restore, espaço não
alocado, etc.
A partir da versão 3.3, foi incluído teste de aleatoriedade (entropia) antes de indexar trechos de arquivos desconhecidos ou não alocado, o que melhora bastante a
eficiência de indexação desses arquivos. Entretanto, eventualmente podem ser perdidos hits cercados por conteúdo "aleatório".
OCR
O OCR utiliza o programa Tess
Tesseract
eract 3.02 e é executado sobre imagens (jpg, tif, png e bmp) e arquivos PDF com pouco texto, fazendo parte da tarefa de parsing dos
arquivos. É o processamento mais pesado e utiliza bastante a CPU, podendo demorar alguns segundos por imagem e retardar em até 10x o tempo de processamento.
Por isso fica desabilitado por padrão e pode ser habilitado no arquivo IPEDConfig.txt (enableOCR).
Os resultados podem variar bastante, dependendo da qualidade e resolução das imagens, tamanho e tipo das fontes utilizadas.
O número
como de caracteres reconhecidos
ocrcharcount:[100 TO *] a qual éretorna
armazenado nocom
imagens metadado
100 ouOCRCharCount,
mais caracteres permitindo localizar
reconhecidos, imagens contendo
ou simplesmente textos,
ordenando porcomo digitalizações, com pesquisas
esse atributo.
O OCR de itens duplicados (segundo o hash) é reaproveitado, otimizando bastante o processamento em alguns casos.
Data Carving
Para ativar o carving, habilite o parâmetro enableCarving no arquivo IPEDConfig.txt. No arquivo conf/CarvingCon
conf/CarvingConfig.txt
fig.txt (enableCarving) há opções para incluir ou
excluir arquivos do processamento, por exemplo, realizar carving apenas sobre o espaço não alocado e/ou sobre itens alocados (por exemplo, pagefile, thumbs.db,
system restore, executáveis, desconhecidos, etc). A configuração padrão é bastante inclusiva, excluindo basicamente os containers com expansão suportada para evitar
a recuperação de itens duplicados.
Atualmente estão configuradas assinaturas para os seguintes tipos de arquivo: sqlite, bmp, emf, gif, png, jpg, webp, html, pdf, ole e derivados (doc, xls, ppt, msg,
thumbs.db), index.dat, rar, zip e derivados (office 2007, OpenOffice, iWork, xps, cdr), eml com anexos base64, avi, wmv, mp4, 3gp, mov,mov, flv, mpeg (tem falsos
f alsos
negativos), wma, wav, midi, cda, shareL/H.dat(ares), podendo ser adicionadas novas assinaturas no arquivo conf/CarvingConfig.tx
conf/CarvingConfig.txt.t.
O algoritmo de carving utilizado é bastante eficiente e não degrada com o número de assinaturas pesquisadas, levando o mesmo tempo caso buscadas 1 ou 10000
assinaturas. É proporcional apenas ao volume de dados processado e ao número de assinaturas encontradas (e não de pesquisadas), conseguindo a atingir taxas entre
300 a 700 GB/h de carving na estação promo2, geralmente limitado pelo I/O.
KnownMetCarving e KFFCarving
A partir da versão 3.10, foram integrados o KnownMetCarving (carving para known.met do Emule) e o KFFCarving (carving de itens presentes na base do LED) pelo
PCF Wladimir. A vantagem do último é que pode recuperar tipos não recuperados pelo carving tradicional (como mpeg) e mesmo itens fragmentados ou sobrescritos
recuperados parcialmente, cujos hashes não dariam hit na base de pornografia infantil do LED, recebem uma nomenclatura especial (CarvedKFF), indicando que se
tratam de fragmentos de arquivos presentes na base do LED.
Miniaturas de Imagens
A partir da versão 3.9 são geradas miniaturas de imagens durante o processamento por padrão, o que pode ser desabilitado. A visualização de imagens na galeria fica
instantânea. Além disso, tornou-se possível filtrar imagens (e vídeos) sem miniaturas geradas (normalmente por estarem corrompidas) por meio de filtro
preconfigurado.
A partir da versão 3.13, alterou-se o GraphicsMagick (GM) para o ImageMagick (IM) para visualizar centenas de formatos de imagens não suportados pelo Java.
Nessa versão, o custo de processamento
processamento na geração de miniaturas
miniaturas foi bastante reduzido,
reduzido, gerando-se miniaturas ddee imagens parciais de carving
carving de formatos comuns
(JPG, PNG, BMP e GIF) via java puro. Pode-se utilizar o GraphicsMagick (GM) no lugar do IM, porém ele suporta metade dos formatos que o IM e é mais lento na
geração de miniaturas de alguns formatos, principalmente WMF.
Esse e outros parâmetros, como tempo de timeout na geração de thumbs, tamanho dos thumbs, número de threads da galeria (importante ao desabilitar geração de
thumbs durante o processamento), podem ser alterados em conf/ImageThumbsConfig.txt
Miniaturas de Vídeos
(contribuição PCF Wladimir)
https://wiki.ditec.pf.gov.br/SEPINF:IPED 3 /1 0
Detecção de Idiomas
A partir da versão 3.13, foi adicionada e fica habilitada por padrão a detecção de idioma via optimaize language-detect (71 idiomas suportados). São adicionados
metadados no grupo language ao itens, que indicam os 2 idiomas mais prováveis e os scores/probabilidades de cada idioma detectado.
Expressões Regulares
A partir da versão 3.13, foi adicionada função de localização de expressões regulares durante o processamento. Por padrão, já estão configuradas algumas expressões
para localização de CPF,
CPF, CNPJ, PisPasep, CNH, email, URL, IP IP,, valores monetários, contas
contas bancárias, boletos, cartão de créd
crédito,
ito, iban, swift, título de eleitor
eleitor.. Quando
existente, é checado o dígito verificador para as expressões padrão. Novas expressões regulares podem ser adicionadas em conf/RegexConfig.txt do profile utilizado.
As ocorrências encontradas das expressões regulares são adicionadas ao metadado Regex:NOME_REGEX, onde NOME_REGEX é o nome configurado da expressão
regular. Dessa forma, os itens podem ser filtrados na aba de metadados de acordo com as ocorrências encontradas por cada expressão regular.
As expressões regulares são pesquisadas no texto extraído após a decodificação dos arquivos. Assim são encontradas ocorrências em formatos
f ormatos complexos como pdf,
office2007, pst, dbx, imagens (com ocr ligado), etc, o que traz resultados muito superiores em relação à outras ferramentas que buscam as regex nos dados brutos dos
arquivos.
Profiles de Processamento
Na v3.12, foi incluída na linha
linha de comando a opção
opção -profile, para a qual pode ser passada
passada uma pré-configuração ddee processamento. Por padrão
padrão são incluídos os
seguintes profiles: forensic, pedo, fastmode, blind.
Caso essa opção não seja utilizada, é utilizada a configuração default de processamento, que por padrão não faz carving e nem OCR, por exemplo. Para criação de um
novo profile customizado, basta copiar um dos existentes dentro da pasta "profiles" (na raiz do IPED), renomear conforme desejado e alterar as opções de
processamento.
A seguir são detalhados esses profiles pré-configurados.
fastmode
Ativada via --fastmode até a versão v3.11. A partir da v3.12 é ativada via "-profile fastmode". Ela realiza um rápido processamento, normalmente em poucos minutos,
minutos,
podendo ser usada em locais de busca, por exem
exemplo,
plo, ou para realizar um preview do doss dados antes de um ex
exame
ame pericial.
Essa opção usa configurações mínimas de processamento: não calcula hash, nem assinatura, não indexa conteúdo, não faz carving, não gera miniaturas de vídeos, não
expande conteineres, nem nenhuma outra tarefa que acessa o conteúdo dos arquivos. Permite assim um processamento rápido, limitado pela decodificação do FS pelo
sleuthkit.
Porém, continua a recuperar itens apagados das tabelas de arquivos, a categorizar os itens (por extensão), permite ordenações e filtros por atributos (nome, extensão,
tamanho, etc), permite visualizar os itens, utilizar a galeria de imagens, a navegação na árvore de diretórios, criação de marcadores e exportação dos arquivos.
forensic
Profile de processamento para exames forense genéricos. São habilitados os hashes md5 e sha-256 (necessário para encontrar anexos do WhatsApp), consulta a base de
Hashes NSRL do NIST, adicionados e indexados o espaço não alocado e file slacks, e realizado o data carving. Não é feito OCR nem tarefas relativas a casos de
pornografia infantil.
edo
https://wiki.ditec.pf.gov.br/SEPINF:IPED 4 /1 0
lind
Profile para extração automatizada de dados. Essa função deve ser usada com cautela e seu uso indiscriminado não é recomendado. Ela extrai os itens automaticamente
com base em categorias pré-definidas no arquivo profiles/blind/conf/CategoriesT
profiles/blind/conf/CategoriesToExport.txt,
oExport.txt, tais categorias podem ser adicionadas e removidas pelo usuário.
Durante a extração automatizada, são ignorados itens presentes na bases de hashes NSRL do NIST, é realizado data carving, porém não são indexados o espaço não
alocado nem file slacks na configuração padrão. Também o OCR fica desabilitado por padrão, o que pode ser alterado.
Linux
O programa é distribuído com todas as dependências necessárias para execução em ambiente Windows.
Windows. Para execução em ambiente Linux, é necessário instalar as
seguintes dependências:
Sleuthkit versão 4.4.2 ou superior (baixar do github e compilar atualmente). Sugere-se a aplicação do patch incluído no IPED, permitindo processar os itens antes
do término da decodificação da imagem;
LibEwf, LibVmdk e LibVhdi, para suporte a imagens E01, VMDK e VHD respectivamente;
Pacote Tesseract versão >= 3.02 e os dicionários português, inglês e OSD (o qual detecta rotação nas imagens)
Pacote ImageMagick, para permitir a visualização de centenas de formatos de imagens não suportadas pelo Java (o qual decodifica apenas bmp, gif, png e jpg)
LibreOffice 4 (apenas para análise), para permitir a visualização das dezenas de formatos suportados por essa suite office.
Oracle Java versão 8 ou superior
superior.. É possível utilizar o OpenJDK, porém este não inclui o Webkit do JavaFX, ficando desabilitado o visualizador HTML e
derivados (EML, emails de PST, etc)
MPlayer para geração de miniaturas de vídeos. Recomenda-se a versão 4.9.2. Necessário configurar o caminho para o mplayer no arquivo
conf/VideoThumbsConfig.txt.
Libpff para decodificação de caixas Outlook OST 2013 e melhor decodificação de PSTs, incluindo recuperação de emails apagados. Necessário utilizar versão a
partir de 2013 para decodificar
decodificar OST 2013. Baixar do link Downloads em https
https://github.com/liby
://github.com/libyal/libpff/wiki
al/libpff/wiki
Libesedb para expansão de banco de dados EDB (contacts.edb, histórico IE 10 e posteriores, Windows Vista Mail, etc). Baixar de
https://github.com/libyal/libesedb/releases
Módulo perl Parse::Win32Registry
Parse::Win32Registry para geração de relatórios de registro via RegRipper, já incluído no IPED.
Utilização
Processamento
Para indexar pastas ou imagens dd, 001, e01 ou iso, utilize a versão linha de comando [1]
(https://sepinf.ditec.dpf.gov.b
(https://sepinf.ditec.dpf.gov.br/dav/Softwares/Analise%20
r/dav/Softwares/Analise%20de%20Midias/Indexa
de%20Midias/Indexador%20e%20Process
dor%20e%20Processador%20de%20Ev
ador%20de%20Evidências%20Digitais/
idências%20Digitais/))
Recomenda-se utilizar um java x64, que permite um maior uso de memória, principalmente em computadores com mais de 4 núcleos de processamento, como as
estações periciais de informática PROMOTEC 2.
Uso: java -jar iped.jar -opcao argumento [--opcao_sem_argumen
[--opcao_sem_argumento]
to]
Alguns parâmetros são listados abaixo, consulte a ajuda de execução (--help) para verificar todos os parâmetros atualizados.
-d: dados diversos (pode ser usado varias vezes): pasta, imagem DD, 001, E01, AFF (apenas linux), ISO, disco físico, ou arquivo *.iped (contendo seleção de
itens a exportar e reindexar)
-dname: nome (opcional) para imagens ou discos físicos adicionados via -d
-o: pasta de saida da indexacao
-r: pasta do relatorio do AsAP3 ou FTK3
-l: arquivo com lista de expressoes a serem exibidas na busca. Expressoes sem ocorrencias sao filtradas
-ocr: aplica OCR apenas na categoria informada. Pode ser usado varias vezes.
-log: Especifica um arquivo de log diferente do padrao
-asap: arquivo .asap (Criminalistica) com informacoes para relatorio HTML
-Xxxx: parâmetros extras de módulos iniciados com -X
-nocontent: não exporta conteúdo de itens do marcador/categoria informado
-importkff: importa diretorio com base de hashes no formato NSRL
-tz: timezone de origem de dispositivos FAT: GMT-3, GMT-4, etc
-b: tamanho em bytes do setor do dispositivo, necessario informar para discos com setores de 4k
https://wiki.ditec.pf.gov.br/SEPINF:IPED 5 /1 0
Análise
Acessível pelo executável "Ferramenta de Pesquisa.exe" ou pelo arquivo indexador/lib/iped-search-app.jar
indexador/lib/iped-search-app.jar.. Necessário possuir instalado o Java JRE (recomendado java
64bits), sendo necessário o Java 7 update 06 para habilitar o visualizador Html e EML.
A interface de análise dispõe das seguintes funcionalidades:
Pesquisa indexada no conteúdo e propriedades dos arquivos
Painel de fragmentos dos arquivos com ocorrências
Tabela de resultados ordenável por propriedades
Visualizaçãoo em árvore dos dados, recursiva ou não
Visualizaçã
Atribuição de múltiplos marcadores textuais, exportação e cópia de propriedades dos arquivos, via menu de contexto
Galeria multithread para exibição de miniaturas de dezenas de formatos de imagem (via GraphicsMagick) e miniaturas de vídeos
Visualizador
Visualizad
pcx, pbm, or para
svg, dezenas
pict, de formatos:
vsd, psd,
vsd, html, pdf, eml, emlx, rtf, doc, docx, xls, xlsx, ppt, pptx, odt, ods, odp, wps, wpd, sxw, eps, dbf, csv, tif, emf, wmf, odg,
cdr, dxf, etc.
Visualizador
Visualizador de texto filtrado para qualquer formato
Visualizador
Visualizador hexadecimal
Exibição dinâmica de colunas, incluindo assunto, remetente e destinatário, autor, cameraModel, data de impressão e centenas de outros.
https://wiki.ditec.pf.gov.br/SEPINF:IPED 6 /1 0
Filtros
Por meio da interface de análise é possível realizar filtros de forma intuitiva por palavras-chave, por categoria, por marcador, por diretório, etc. ATENÇÃO, pois
sempre são listados na tabela os arquivos resultantes da INTERSEÇÃO de todos os filtros ativos! Caso haja mais de um filtro aplicado, é mostrado um alerta em
ermelho para o usuário, para alertar sobre uma possível filtragem de dados acidental.
Além disso, é possível criar e salvar filtros avançados customizados, por meio do botão Opções -> Gerenciar Filtros. Por padrão, são incluídos os seguintes filtros pré-
configurados:
Filtrar Duplicados
Filtrar KFF Ignoráveis
Filtrar Duplicados e Ignoráveis
Alerta de Hash
Alerta de Hash (PI)
Arquivos Criptografados
Erro de Parsing
Erro de Leitura
Timeout ao Processar
Itens Ativos
Itens Apagados
Itens Recuperados
Itens Georreferenciados
Subitens de Conteineres
Conteineres não Expandidos
Imagens com Possível Nudez
Imagens e Vídeos com Miniaturas
A partir da versão 3.13, foi criada uma nova aba na interface de análise denominada "Metadados". Essa aba é uma generalização da aba de Categorias, pois por meio
dela é possível agrupar e filtrar
f iltrar os itens com base nos valores de qualquer metadado ou propriedade existente. Foram criados novos grupos de metadados para facilitar
o uso dessa função, por exemplo:
básicos: nome, extensão,
extensão, tamanho, categoria, hash
hash,, deletado, datas
avançados: contentType,
contentType, classeNudez, kffstatus, kffgroup, ocrCharCount, hashes
email: subject, from, to, cc, bcc, date
https://wiki.ditec.pf.gov.br/SEPINF:IPED 7 /1 0
Georreferenciamento de Imagens
Função incluída na v3.11 pelo PCF Patrick. Basicamente casos contendo imagens com informações de GPS nos metadados exif são renderizadas no painel "Mapa",
permitindo visualizar sua
sua localização de origem.
Também foi incluído um filtro "Itens Georreferenciados" para facilitar a localização de itens contendo informações de GPS.
Função incluída na v3.11. Com ela é possível abrir e analisar de forma integrada diversos casos simultaneamente, incluindo casos independentes processado
processadoss em
computadores diferentes. Essa função deve ser utilizada via linha de comando no terminal:
A partir da v3.11, são criados marcadores automáticos para itens localizados na evidência e compartilhados via aplicativos Emule, Ares e Shareaza, e a partir da v3.12,
para itens enviados via Skype
Skype e WhatsApp. Para o fun
funcionamento
cionamento é necessário, antes
antes do processamento,
processamento, habilitar os hashes utilizados
utilizados por cada aplicativo no controle
de arquivos transferidos: md5 para Shareaza, sha-1 para Ares, edonkey para Emule, sha-256 para WhatsApp. Basicamente os hashes presentes nos arquivos de controle
de transferências são pesquisados no caso e, caso encontrados, são criados marcadores automáticos para esses itens por aplicativo. Tais itens não são necessariamente
ilícitos, devendo ser inspecionados pelo perito. No caso do Skype, não há registro dos hashes dos itens transferidos, por isso são utilizadas as informações de
"tamanho" E "caminho original", ou "tamanho" E "nome" caso o item não seja localizado no "caminho original" ou caso esta informação não esteja disponível.
Os marcadores criados são automáticos e referem-se a transferências prováveis, devendo ser confirmadas pelo perito.
Função incluída na versão 3.12, possibilitando analisar o caso antes do término do processamento. A qualquer momento pode ser acionado o botão "Atualizar" na
interface, disponível apenas durante o processamento, para carregar novos itens processados.
Importante destacar que, atualmente, apenas ficam disponíveis para análise itens processados por completo. Itens com alguma tarefa pendente (como indexação) ficam
indisponíveis, inclusive na árvore de diretórios, a qual fica incompleta até o término do processamento. Porém, itens já disponibilizados para análise estão finalizados,
significando que todas as funções de análise já estão disponíveis para esses itens, como visualização de miniaturas de imagens e vídeos na galeria, filtro de itens sem
miniaturas, buscas indexadas, georreferenciamento, etc. Além disso, os itens não mudarão de categoria como em outros softwares, pois a análise de assinatura, assim
como as demais tarefas, já terá sido finalizada.
Essa funcionalidade deve ser utilizada com cautela e seu uso indiscriminado não é recomendado.
Por Categorias:
Para realizar extração automática de arquivos por categoria, utilize a opção "-profile blind" ou descomente as categorias de interesse no arquivo
conf/CategoriesToExport.txt antes do processamento. Nesse caso, os arquivos são exportados e apenas eles indexados, podendo o rresultado
conf/CategoriesToExport.txt esultado do processamento ser
enviado para o solicitante da extração de dados, via mídia óptica ou magnética.
Por Palavras-chave:
Para realizar extração automática de dados por palavras-chave, insira as palavras-chave ou expressões regulares de interesse, uma por linha, no arquivo
conf/KeywordsToExport.txt
conf/KeywordsT oExport.txt dentro do profile desejado. Os arquivos contendo as palavras ou expressões definidas serão exportados. Diferenças de capitalização e
acentuação são ignoradas. Os hits são adicionadas ao metadado Regex:KEYWORDS dos itens, permitindo filtrar os itens por palavra/expressão encontrada.
https://wiki.ditec.pf.gov.br/SEPINF:IPED 8 /1 0
Após atribuir marcadores aos arquivos (opcional), os arquivos de interesse a serem exportados devem ser selecionados (via checkbox) na interface de análise. Essa
seleção pode ser salva via função
f unção "Salvar marcadores" em um arquivo *.iped, ex: Report.iped. Posteriormente, via terminal, forneça esse arquivo (ou o arquivo padrão
indexador/marcadores.iped)
indexador/marcadores.ip ed) como parâmetro para uma nova indexação:
-nocontent Marcador1: exporta as propriedades e as miniaturas dos itens do Marcador1, mas nao exporta os arquivos originais, útil para imagens e vídeos.
A partir da versão 3.11, é possível gerar um único relatório a partir de múltiplos casos:
Também pode
pode ser usada a opção --nopstattachs caso se queira desabilitar a inclusão automática no relatório de anexos de emails selecionados extraídos de PST.
Os arquivos selecionados serão exportados e reindexados para facilitar a revisão dos dados pelo solicitante do exame.
Relatório HTML
O programa foi otimizado para suportar casos na casa de 10 milhões de itens com poucos giga de memória, havendo degradação principalmente na ordenação das
propriedades atualmente.
atualmente.
Considerações finais
A precisão dos resultados têm sido considerada satisfatória para atender aos objetivos propostos, mas nunca será 100%, pois há uma infinidade de tipos de arquivos a
tratar. Por isso, os resultados da ferramenta podem diferir dos resultados de outras ferramentas forenses, podendo haver diferença tanto para mais quanto para menos.
Por exemplo, em relação a ferramenta AccessData FTK, atualmente há diferenças de configuração que resultam num menor número de itens no caso, o que pode ser
equivocadamente interpretado como uma deficiência do software numa análise superficial. Note que a inclusão de muitos itens inúteis no caso pode dificultar a análise
ao invés de ajudar. Abaixo são citadas algumas das diferenças:
trechos não alocados são menos fragmentados;
arquivos de carving claramente corrompidos, menores que 1KB ou maiores que 10MB são ignorados na configuração padrão;
não são expandidos históricos de Internet nem arquivos JAR (que podem produzir dezenas de milhares de itens .class);
informações EXIF são extraídas sem a criação de subitens sob as imagens;
não são gerados itens desnecessários com o resultado do OCR
não são extraídas miniaturas das imagens a partir da v3.6
Caso sejam identificadas divergências importantes, entre em contato e relate o problema para que ele possa ser corrigido.
Disponível em "http://wiki.ditec.pf.gov
"http://wiki.ditec.pf.gov.br/index.php?title=
.br/index.php?title=SEPINF:IPED&oldid=17
SEPINF:IPED&oldid=17796"
796"
https://wiki.ditec.pf.gov.br/SEPINF:IPED 10/10