0001 Multimedia DB
0001 Multimedia DB
Roberto Basili
Basi di Dati e Conoscenza
a.a. 2013-2014
Major Issues:
Presentation & Delivery Support
• How do we specify the content of multimedia presentations?
• How do we specify the form (temporal/spatial layout) of this
content?
• How do we create a presentation schedule that satisfies these
temporal/spatial presentation requirements?
• How can we deliver a multimedia presentation to users when
there is
• a need to interact with other remote servers to assemble the
presentation (or parts of it)
• a bound on the buffer, bandwidth, load, and other resources
available on the system
• a mismatch between the host server's capabilities and the
customers machine capabilities?
• How can such presentations optimize Quality of Service (QoS)?
Scenari Applicativi: Prestospace
MM Database 11
Possible Queries
Image Query (by example):
• Police officer Rocky has a photograph in front of him.
• He wants to find the identity of the person in the picture.
• Query: “Retrieve all images from the image library in which
the person appearing in the (currently displayed)
photograph appears”
MM Database Architectures
Based on Principle of Autonomy
• Each media type is organized in a media-specific manner suitable for
that media type
• Need to compute joins across
different data structures
• Relatively fast query
processing due to
specialized structures
• The only choice for legacy
data banks
MM Database 15
• In quali rappresentazioni?
MIR: sfide
1. Unità di significato:
1. Ne esistono?
2. Possiamo assumere che la musica ne abbia (anche
ipotizzando che tutte le rappresentazioni siano disponibili)?
2. Polifonia: voci indipendenti si esprimono in “parallelo”,
similmente ad attori in una storia
3. Riconoscimento delle note (audio only)
4. Altro:
• Una interazione realmente musician-friendly è
molto difficile
• Eterogeneità: stili, mode
Questioni aperte
• Analisi del dato musicale
• Sintesi delle informazioni astratte riguardo al contenuto
• Stima della similarità
• Strumenti di MIR
• Indicizzazione
• Interrogazione
• Visualizzazione
Music Retrieval:
una Architettura generale
Users
Music
Music
Query
Player
Interface
Query result
Result music objects Music query
Music Music
Database Index
MIR: Rappresentazioni
Media
Music_Info
key
beat
tempo
Acoustical
loudness
Music
pitch
info duration
acoustical brightness
thematic bandwidth
Thematic
theme*
rhythm
melody
chord
IS-A relationship
composition relationship
Music _Wave Music _MIDI Music_AU
* multi-valued attribute
Unità di significato musicali
• L’informazione testuale è surrogata quasi
esclusivamente attraverso le parole
• “concepts vs. words”
• Non è chiaro se in musica esista un analogo delle
parole
• Non esistono delimitazioni esplicite (come in Cinese)
• Non c’e’ accordo tra gli esperti di delimitazioni esistenti tra
“parole” musicali (non come nel Cinese)
• La musica è dopotutto un’arte => il “significato” è molto +
sottile!
• Le note sono parole?
• No. Esse sono relative poichè l’intonazione è rilevante
(no context-freeness)
• Sono gli intervalli di pitch equivalenti a parole?
• No. Il loro livello è ancora troppo basso: piu’ o meno
come i caratteri
Unità di significato musicali (2)
• Le sequenze di pitch-interval sono parole?
• In un certo senso si’, ma
• Trascurano il ritmo
• Non rispondono delle relazioni tra voci diverse (armonia)
• La loro correlazione con il significato musicale è piuttosto bassa
• Gli accordi sono parole? (Christy Keele)
• Le progressioni di accordi possono essere assimilate a frasi
• Ignorano melodia e ritmo (critici per la musica tonale)
• In sintesi, moltissima musica non dipende strettamente
dalla intonazione e dalle singole note !
Musica, testo e altri media
——————Struttura Esplicita ————————— Indicatori di Salience
chorus
refrains
transitions
verse
couplets
38 Classes
Raw Raw
Classifi Classific
Hierarchical Hierarchical cation ation
Classification Classification Accura Accurac Runtime Confusion Matrix
Rank Participant Accuracy Accuracy Std cy y Std (s) Machine Files
9 Classes
Raw Raw
Classifi Classific
Hierarchical Hierarchical cation ation
Classification Classification Accura Accurac Runtime Confusion Matrix
Rank Participant Accuracy Accuracy Std cy y Std (s) Machine Files
1 McKay & Fujinaga 90.00% 0.60 84.44% 1.41 18,375 R MF_9eval.txt
Basili, Serafini, &
2 Stellato (NB) 81.56% 0.76 72.00% 0.88 N/A N/A BST_NB_9eval.txt
3 Li, M. 80.22% 1.47 72.00% 2.31 3,777 G L_9eval.txt
Basili, Serafini, &
4 Stellato (J48) 76.67% 1.11 65.33% 1.65 N/A N/A BST_J48_9eval.txt
Ponce de Leon &
5 Inesta 50.67% 1.26 37.78% 2.30 197 L PI_9eval.txt
MidXLog (Basil et al., 2005)
• Elaborazione dei File MIDI (esempi)
• Basata su Prolog
• Feature extraction basato su pattern matching
complesso (unification-based)
• 20 Features Types:
• Piece oriented: Drum instruments Distribution,
Pitched/Percussive/SFX/Drums Percentage, Melodic
Intervals, Instruments (Single Instruments, Binary and
Weighted), Instrument Classes and Drum-kits
• Tempo, Time and Key Oriented
• Pitch Wheel
Elaborazione Prolog del file MIDI
• Gestione separata di sezioni con differenti
TimeSignature And/Or KeySignature
• Output: una sequenza di strutture quali
(TimeSignature,KeySignature)-Section
• La regola generale è:
If ( "midiPiece contains only one
KeySignature"
AND
KeySignature(time(0)) == 'C')
Then guessKeySignatures(midiPiece)
Else computeKeySignatures(midiPiece)
Events in MidiXLog
• Tracks are almost completely ignored
• Channels
• Instruments played on those channels
instr(Instr,InstrSectionDelimiters)
• JEON, J., LAVRENKO, V., AND MANMATHA, R. 2003. Automatic image annotation and
retrieval using crossmedia relevance models. In Proceedings of the Annual International
ACMSIGIR Conference on Research and Development in Information Retrieval.
• RITENDRA DATTA, DHIRAJ JOSHI, JIA LI, and JAMES Z. WANG, Image Retrieval: Ideas,
Influences, and Trends of the New Age, ACM Computing Surveys, Vol. 40, No. 2, April 2008.
• Jonathon S. Hare, Patrick A.S. Sinclair, Paul H. Lewis, Kirk Martinez, Peter G. B. Enser, and
Christine J. Sandom, Bridging the Semantic Gap in Multimedia Information Retrieval, 3rd
European Semantic Web Conference, (2006)
• Music IR: N. Orio, "Music Retrieval: A Tutorial and Review," Foundations and Trends® in
Information Retrieval, vol. 1, no. 1, pp. 1-90, Oct. 2006. URL:
http://www.nowpublishers.com/articles/foundations-and-trends-in-information-retrieval/INR-
002
• Douglas Turnbull, Luke Barrington, David Torres, and Gert Lanckriet Semantic Annotation
and Retrieval of Music and Sound Effects, IEEE Transactions on Audio, Speech, and
Language Processing, February 2008