Académique Documents
Professionnel Documents
Culture Documents
ESCRITA MUSICAL
5
5
5
9
9
11
12
14
14
16
17
19
20
22
23
RESOLUO
ORIENTAO
23
23
24
OBJECTIVOS
PROCEDIMENTO
VANTAGENS IMPORTANTES DA PR-CODIFICAO
24
24
25
26
OBJECTIVO
PROCEDIMENTO
LOCALIZAO DE FRAGMENTOS DAS LINHAS
CONSTRUO DE LINHAS
SELECO DE LINHAS
OUTROS MTODOS DE DETECO DE LINHAS EXPERIMENTADOS
26
26
26
27
28
29
SEPARAO DE OBJECTOS
30
OBJECTIVO
PROCEDIMENTO
SEPARAO DOS OBJECTOS - REMOO DAS LINHAS
30
30
30
1
32
36
OBJECTIVO
PROCEDIMENTO
PR-ALISAMENTO
CLCULO DAS DERIVADAS - DIFERENCIAO PONDERADA
CLASSIFICAO DE SEGMENTOS DE CURVATURA CONSTANTE
36
36
36
36
37
40
PR-CLASSIFICAO DE OBJECTOS
41
43
43
43
44
44
44
45
45
45
45
46
INTERPRETAO
47
CLASSIFICAO DE NOTAS
OBJECTIVO
MTODOLOGIA
EFICCIA
CLASSIFICAO DE ALTERAES
OBJECTIVO
METODOLOGIA
ATRIBUIO DE ALTERAES
OBJECTIVO
ACIDENTES
PONTOS DE AUMENTAO
OUTROS SMBOLOS
ORDENAO DE EVENTOS
DESCRIO
METODOLOGIA
EFICCIA
PR-PROCESSAMENTO DE EVENTOS
DURAO DE UM EVENTO
NMERO DE VOZES
47
47
47
48
49
49
49
49
49
49
50
50
51
51
51
52
52
52
53
2
SEPARAO DE VOZES
DESCRIO
METODOLOGIA
EFICCIA
INTERPRETAO DE VOZES
OBJECTIVO
GERAO DO FICHEIRO DE SADA EM FORMATO SCORE
GERAO DO FICHEIRO DE SADA EM FORMATO MIDI
PERDA DE INFORMAO
AUSNCIA DE INDICAO DE COMPASSO
AUSNCIA DE EDIO PRVIA DAS PAUTAS RECONHECIDAS
ESTRUTURA DO FICHEIRO MIDI GERADO
53
53
55
55
55
55
57
57
57
57
57
57
RESULTADOS E CONCLUSES
59
EFICCIA
CRITRIOS DE AVALIO
ANLISE DE RESULTADOS
EFICINCIA
TEMPOS RELATIVOS
TEMPOS ABSOLUTOS
CONCLUSES FINAIS
59
59
59
60
60
60
60
BIBLIOGRAFIA
62
62
63
63
64
64
64
64
65
67
INTRODUO
A utilizao de um suporte informtico para a representao musical hoje cada vez mais
frequente. Entre as possiveis aplicaes podemos destacar:
edio musical
reproduo via MIDI
manipulao das pautas (transposies, alteraes na digitao, etc)
bases bibliogrficas
gerao de pautas em braile
anlise musical (estrutura, estilo, etc)
Seria assim de grande utilidade um sistema que permitisse, partindo da leitura ptica de uma
pauta de msica, a sua traduo para um suporte informtico.
Assim surgiu o RIEM (Reconhecimento e Interpretao de Escrita Musical) como uma
tentativa de abordar este problema.
Foi nosso objectivo durante este projecto, o desenvolvimento de um programa com estruturas
slidas por forma a poder permitir o seu desenvolvimento futuro quer em termos de aumentar
o dicionrio de smbolos reconhecidos como em termos de o expandir a outras reas de
tratamento musical. Paralelamente, procurmos priviligiar o campo da edio musical, apesar
de termos includo um conversor para o formato Midi, por este ser o mais exigente e o mais
completo no que respeita informao que necessrio transmitir.
ESCRITA MUSICAL
Nota Histrica
A escrita musical teve ao longo dos sculos, vrias formas e notaes diferentes, que
acompanharam diversas correntes e gneros musicais.
Na notao musical actual, embora com uma base comum, subsistem pequenas diferenas,
procurando responder s exigncias de diferentes estilos musicais (clssico, jazz,
contemporneo ...) e tambm de numerosos instrumentos com particularidades tcnicas
distintas.
Este projecto contempla a notao musical actual, no estilo clssico, englobando um universo
restrito de smbolos musicais que descreveremos posteriormente.
As linhas de um pentagrama referenciam-se de baixo (1) para cima (5). Quando a cabea
de uma nota se situa acima da 5 linha ou abaixo da 1 vulgar representar pequenos
segmentos que permitam visualizar a posio relativa da nota. Estes segmentos denominamse por linhas suplementares.
Os pentagramas esto normalmente divididos, por barras verticais, em compassos ou seja
divises temporais de igual durao. Os pentagramas podem surgir agrupados em
sistemas, unidos pelas barras de diviso de compasso, e por vezes por uma chaveta na
margem esquerda, abrangendo todos os pentagramas de cada sistema.
Smbolos Constituintes
Os smbolos que constituem a escrita musical esto dispostos sobre ou prximo dos
pentagramas. A sua posio determina quase sempre o seu significado ou valor.
Os principais smbolos que assentam sobre linhas so as claves, as notas e as pausas.
Notas
A posio das notas na pauta representa relaes relativas de altura. A cabea da nota pode
ser colocada sobre as linhas ou nos espaos que as separam. A sua localizao sobre ou
entre as linhas determina a sua altura. A sua forma ou figura indicam a durao do som.
E S C R I T A M U S I C AL
perna
trao
cauda
cabea
Vrias notas de diferentes duraes podem ser unidas por um trao horizontal, a que
chamamos grupo, em combinaes quase ilimitadas. As notas podem ainda ser agrupadas
verticalmente, em acordes, ocorrendo por isso no mesmo instante temporal.
A unidade de medida a semibreve, que pode ser subdividida como se ilustra na figura.
Note-se que estas divises so apenas em potncias de dois.
semibreve
semibreve
seminima
colcheia
semicolcheia
fusa
semifusa
Quando se pretende dividir o valor de uma nota, por exemplo, em trs partes iguais utiliza-se
a figura mais prxima, correspondente a esse divisor, mas coloca-se o algarismo 3 sobre o
grupo de trs notas.
E S C R I T A M U S I C AL
Tercinas e Quintinas
Pausas
As pausas representam eventos silenciosos numa msica. A durao destas pausas
tambm representada pela sua figura. Assim, correspondentes aos smbolos das notas
existem smbolos para as pausas, com igual durao:
pausa de semibreve
pausa de mnima
pausa de semnima
pausa de colcheia
pausa de semicolcheia
pausa de fusa
Pausas
A pausa de semibreve surge sob uma linha enquanto que a de mnima surge sobre uma
linha.
Claves
A altura absoluta do som (das notas) s determinada pela colocao de uma clave na
pauta correspondente. As claves definem a altura absoluta de uma das cinco linhas do
pentagrama onde se colocam, determinando-se a altura de todas as notas a partir dessa
referncia. Actualmente utilizam-se trs tipos de claves:
E S C R I T A M U S I C AL
Sol (2 linha)
F (4 linha)
D (3 linha)
D (4 linha)
Claves
Note-se que a clave de D pode surgir em duas posies diferentes, indicando que o d se
situa na 3 ou na 4 linha.
Pontos de Aumentao
Tanto as notas como as pausas podem ser prolongadas em metade da sua durao
colocando um ponto direita da cabea da nota ou direita da pausa.
+
+
Ponto de aumentao
Indicaes de Compasso
No comeo de um trecho musical, indica-se mediante algarismos, a dimenso (valor
temporal) que devem ter os compassos, delimitados por sucessivas barras verticais. Esta
indicao apresenta normalmente a forma de uma fraco; por exemplo a indicao 3/8 diznos que cada compasso ter a durao equivalente a 3*1/8 semibreve, ou seja 3*colcheias (
ver quadro notas e sua durao relativa).
...
Os tempos de compasso mais frequentes surgem por vezes abreviados, representados por
uma letra;
Acidentes
Os acidentes so smbolos que alteram a altura das notas quando colocados imediatamente
antes destas.
Sustenido
E S C R I T A M U S I C AL
Duplo sustenido
eleva um tom
Bemol
Duplo bemol
baixa um tom
Bequadro
Ligaduras
As ligaduras, surgem normalmente sobre ou sob a notas, e tal como o nome indica, ligando
ou abrangendo vrias notas.
Exemplos de ligaduras
E S C R I T A M U S I C AL
Interseco de smbolos
Nas imagens mais densas podem surgir smbolos colados a outros. A prpria notao
musical permite ainda (nem sempre evitvel) que alguns smbolos se sobreponham.
Smbolos sobrepostos
Smbolos colados
10
E S C R I T A M U S I C AL
Dificuldades de Reconhecimento
Similitude entre smbolos com significados diferentes
Existem de facto alguns smbolos que so exactamente iguais, e no entanto com significados
diferentes, mas na maioria dos casos a posio do smbolo determinante. So exemplo os
pontos de aumentao e marcas de staccato (exemplo da figura), ou ainda as pausas de
semibreve / pausas de mnima.
Os casos mais delicados so aqueles em que o efeito do rudo torna ambgua a identidade
de um smbolo, podendo mesmo confundi-lo com outro semelhante. So exemplos:
sustenidos com bequadros (exemplo da figura), hastes separadas de notas com barras de
diviso de compasso, ou ainda algarismos 0(zero) ou letras O com semibreves.
11
E S C R I T A M U S I C AL
Dificuldades de Interpretao
Vozes concorrentes
A diviso de vozes uma tarefa que envolve conceitos complexos e conhecimentos musicais
difceis de representar num algortmo, e nem sempre possvel efectuar correctamente esta
diviso, pela simples disposio grfica das notas de um trecho musical.
Cruzamento de pentagramas
possvel que a representao de uma frase musical (voz) atravesse dois pentagramas de
um mesmo sistema. o caso frequente das pautas para piano em que as notas graves
(metade inferior das teclas) e as notas agudas(metade superior das teclas) so escritas em
dois pentagramas separados. Por isso normalmente as notas executadas por cada mo so
escritas em pentagramas distintos , no entanto as mos podem cruzar-se durante a
execuo...
Mtrica incompleta
Na escrita musical corrente por vezes omitida alguma informao que intuitivamente tida
em conta pelo executante experimentado. Trata-se de mais um caso de conhecimento
emprico de dificil representao. Na perspectiva do reconhecimento e interpretao
automtica, estas omisses so tidas como falhas. A resoluo deste problema passa pela
adopo de algumas regras de sincronizao que permitam resolver os casos mais
frequentes. Note-se ainda que este problema est intimamente ligado com a diviso de
vozes.
12
E S C R I T A M U S I C AL
13
smbolos compostos
Por smbolos elementares, refermo-nos aqueles que, tendo por funo a alterao das
caractersticas de uma nota ou de uma pauta, quer em termos de altura, quer em termos de
expresso musical, apenas podem existir numa forma isolada, sempre igual em termos de
estrutura e podendo apenas variar no seu tamanho.
Nesta categoria, podemos encontrar os seguintes smbolos:
acidentes
pontos de aumentao
ligaduras
claves
divises de compasso
entre outros.
Incluremos tambm nesta categoria, por existirem sempre de uma forma isolada e igual,
apesar de no estarem abrangidos pela descrio acima mencionada, os seguintes smbolos:
pausas de semibreve
pausas de mnima
14
R E P R E S E N T A O D A E S C R I T A M U S I C AL
pausas de semnima
A razo desta diviso tem directamente haver com o formato do ficheiro de sada como
veremos mais adiante.
Por smbolos compostos, referimo-nos s:
pausas de durao igual ou inferior a uma colcheia:
cabea preta
(NP)
cabea branca
(NB)
haste de nota
(NS)
haste de pausa
(RS)
cauda de nota
(NT)
cauda de pausa
(RT)
15
R E P R E S E N T A O D A E S C R I T A M U S I C AL
trao
(B)
clave de Sol
(TR)
clave de F
(BA)
clave de D
(AL)
pausa de seminima
(QR)
pausa de mnima
(HR)
pausa de semibreve
(WR)
diviso de compasso
(M)
Necessitamos agora de encontrar uma forma para descrever um dado objecto a partir das
primitivas que o constituem.
rvores de primitivas
Uma forma de obter esta descrio do objecto seria atravs de uma rvore cujos ns seriam
as primitivas, e cujas ligaes entre ns representariam uma ligao fisica entre elas. Para
construir esta rvore de modo a torn-la unvoca e facilitar a posterior interpretao, foi
necessrio definir uma espcie de hierarquia de primitivas no que respeita ordem pela qual
elas seriam detectadas. Esta hierarquia de certa forma est implicitamente definida na forma
como os objectos compostos so construdos porquanto existem primitivas que afectam todo
ou parte do objecto, ao passo que outras no tm influncia no resto do objecto. Como
exemplo do primeiro caso temos os traos nos grupos de notas que influenciam a durao de
todas as notas por eles abrangidas e portanto devem ser ascendentes de todas as subrvores por eles afectadas.
A ordem pela qual as primitivas sero procuradas dada pelo seguinte esquema:
0
1
1
0
1
1
1
1
0 - no encontrou
1 - encontrou pelo menos uma
Assim, e comeando pelo canto superior esquerdo, as primitivas sero detectadas de acordo
com o esquema, e a respectiva rvore construda a partir da raz em direco s folhas.
16
R E P R E S E N T A O D A E S C R I T A M U S I C AL
Tendo como ponto de partida as rvores de primitivas que descrevem os objectos, agora
necessrio relacion-las de forma a descrever as suas posies relativas.
esquerda de
Assim, para cada objecto que no estivesse envolvido por outro, procurar-se-iam os seus
vizinhos direito e esquerdo para construir uma rede de rvores.
17
R E P R E S E N T A O D A E S C R I T A M U S I C AL
imagem
objectos
rvores de primitivas
B
B
NS
NS
NS
NP
NP
NP
NP
rede de rvores
2
RT
RT
RS
RT
RS
NS
NB
relao
envolvente
relao
esquerda/direita
No passo seguinte, seria necessrio eliminar todas as relaes do tipo envolvente de modo a
que a posio exacta do objecto envolvido no objecto envolvente, em termos musicais, seja
determinada.
Para isso, recorre-se a uma primitiva artificial, que represente uma separao fsica dos
objectos, e permita a insero da rvore do objecto envolvido na rvore do objecto
envolvente.
Assim, para o exemplo anterior, a relao envolvente seria eliminada atravs da juno das
duas rvores na seguinte rvore:
B
B
//
NS
NS
NP
NP
NS
1*
RT
NP
RS
NP
1*
Este artifcio, em algumas situaes, poderia ser til para eliminar erros devidos a separao
indevida de objectos como seja o caso de uma haste quebrada no interior de um grupo de
notas.
18
R E P R E S E N T A O D A E S C R I T A M U S I C AL
Eficcia
Partindo do princpio de que seria vivel o reconhecimento das primitivas e construo das
rvores nos termos descritos acima, podemos conclur que sendo uma forma de
representao musical muito prxima da utilizada nas pautas, no que respeita estrurura dos
smbolos, obtem-se uma boa descrio dos objectos.
no entanto pouco eficiente nos seguntes pontos:
Manipulao de estruturas
Este mtodo representa uma grande carga em termos de manipulao de estruturas pois a
leitura das rvores nem sempre to simples como a descrita.
A extenso deste mtodo para pautas com vozes concorrentes, introduziria vrios problemas
por vezes de dificil resoluo de onde destacamos os seguintes:
Seria necessrio introduzir dois novos tipos de relaes entre objectos (acima de e abaixo
de) para permitir descrever dois objectos referentes a duas vozes concorrentes como o
exemplo da figura.
19
R E P R E S E N T A O D A E S C R I T A M U S I C AL
Para descrever um objecto deste tipo, teriamos que abandonar o modelo das hierarquias pois
segundo este no poderiamos representar a haste assinalada na figura. Teriamos ento de
construir a rvore apenas a partir das relaes grficas entre elas.
Esta alternativa permitiria manter uma descrio fiel dos objectos mas introduziria problemas
muito complicados aquando da interpretao da rvore.
Exemplo complexo
Seria extremamente complicado de resolver este tipo de relaes pois o resultado final seria
composto por vrias rvores, consoante o nmero de vozes representadas. Poderiam
inclusivamente existir casos onde num pentagrama houvesse um objecto que envolvesse
todos os outros, caso que seria de quase impossivel resoluo utilizando este mtodo.
Em concluso, temos que este mtodo, ainda que relativamente eficiente no que respeita
representao de pautas simples, poderia implicar, aquando da sua aplicao a casos mais
complexos, a introduo de problemas impossveis de resolver e a consequente estagnao
do projecto. Isto deve-se fundamentalmente ao facto de estarmos unicamente a descrever a
imagem sem praticamente nenhuma utilizao do conhecimento existente partida sobre a
notao musical e a forma como os objectos so construdos. Seria portanto necessrio
desenvolver outro tipo de representao musical que se distanciasse mais da imagem de
entrada e se aproximasse do formato do ficheiro de sada, interpretando algumas
caracteristicas dos objectos aquando do reconhecimento por forma a facilitar o mesmo e o
posterior processo de interpretao.
a durao
20
R E P R E S E N T A O D A E S C R I T A M U S I C AL
A par desta separao de eventos, seria necessrio manter informao que relacione todos
os eventos extrados de um mesmo objecto (no caso de grupos de notas) para que
posteriormente eles possam ser reagrupados pelo editor de msica.
Feita esta identificao de eventos, e aps a sua ordenao em termos de instante em que
ocorrem, temos uma pauta descrita como uma sequncia temporal de eventos.
Definindo dois tipos de eventos <R> e <N>, representando pausas (rests) e acordes de notas
respectivamente, temos para o seguinte exemplo:
Para cada evento viria associada informao sobre a sua durao (normalmente associada
ao nmero de traos/caudas), e para o caso dos eventos tipo <N>sobre as notas que o
compem. Paralelamente teramos que manter informao sobre o facto de os eventos 2, 3 e
5 pertencerem ao mesmo grupo de notas.
Dos smbolos elementares:
as trs pausas sero tratadas como eventos do tipo <R>
<N>
nota
<R>
pausa (Rest)
<TR>
<BA>
clave de F (Bass)
<AL>
<TE>
R E P R E S E N T A O D A E S C R I T A M U S I C AL
<M>
<SIGN>
A representao de uma pauta com vozes concorrentes fica resolvida com a possibilidade de
existirem eventos simultneos como se demonstra no seguinte exemplo:
R
M
BA
SIGN
N
N
Eficcia
Em comparao com o mtodo de representao por rvores de primitivas, podemos
salientar as seguintes vantagens:
maior clareza.
possibilita a representao de vozes concorrentes de uma forma simples.
diminui a carga em termos de manipulao de estruturas pois no necessita de
complexas leituras a rvores o que implica uma maior eficincia.
elimina o problema criado pelos objectos envolvidos por outros.
facilita o processo de reconhecimento pois a procura das caracteristicas de um
evento faz-se de uma forma muito mais localizada, com um grau de incerteza
menor, aumentando a sua taxa de sucesso.
Por representar um bom ponto intermdio entre a imagem de entrada e o ficheiro de sada,
esta foi a opo escolhida.
22
Resoluo
A resoluo recomendada dever situar-se entre os 300 e os 400 dpi (dependendo do
tamanho das pautas). Para resolues inferiores a 300 dpi o reconhecimento de alguns
smbolos poder ser defeituoso ou omisso. Para resolues superiores a 400 dpi teremos
informao redundante, podendo resultar num excesso de recursos de memria, que o
programa ou o sistema podero no alocar. Uma imagem de tamanho A4, digitalizada a 300
dpi tem um tamanho de pouco mais de 1 MB.
A imagem dever ser binria (1 bit por pixel).
Orientao
As imagens de entrada devero estar orientadas longitudinalmente (Portrait), caso contrrio
dever recorrer-se a software de manipulao grfica que permita efectuar uma rotao de
90, sobre o ficheiro TIFF.
23
Procedimento
A matriz de pontos que constitui a imagem binria original, analizada coluna a coluna. Em
cada coluna memorizam-se sequencialmente os comprimentos dos segmentos (sequncias)
de bits encontrados, alternadamente brancos (bits = 0) e pretos (bits = 1). Para cada coluna
regista-se ainda o nmero de segmentos encontrados.
Esta segmentao permite assim reduzir significaticamente a informao que necessria
manter em memria. Note-se que esta reduo inversamente proporcional complexidade
de uma imagem; uma imagem complexa conter colunas com um maior nmero de
transies branco/preto ou preto/branco resultando por isso um maior nmero de segmentos
necessrios para representar essas colunas.
Ainda, o primeiro segmento de cada coluna ser obrigatoriamente um segmento branco, que
ter comprimento = 0 caso a coluna se inicie realmente por um segmento preto. Esta
obrigatoriedade vai permitir melhorar a eficincia no acesso informao contida na imagem,
j que se garante priori que todos os segmentos brancos ocuparo ordenadamente
posies pares e os segmentos pretos posies mpares.
Vejamos um pequeno exemplo ilustrativo:
"
&
'
&
'
&
24
P R - C O D I F I C A O D A I M AG E M - C O M P R I M E N T O S D E S E Q U E N C I A
A codificao da imagem decorre em simultneo com a leitura do ficheiro TIFF. Surge aqui
uma dificuldade resultante do facto de a leitura do ficheiro ser feita por linhas e no por
colunas como seria favorvel. Assim, uma linha da imagem lida do ficheiro, de cada vez,
procedendo-se actualizao de todas as colunas da matriz de segmentos, em cada leitura.
25
Procedimento
Localizao de fragmentos das linhas
A matriz de segmentos verticais percorrida uma nica vez por colunas, procurando localizar
segmentos contguos horizontalmente de comprimento aproximado e inferior a um mximo
estabelecido (chamaremos MAXCOMP) que podero constituir fragmentos das linhas. Uma
lista mantm, todos os fragmentos abertos, que so actualizados na leitura de cada nova
coluna da imagem. Cada entrada nessa lista mantm registo do comprimento do fragmento
da sua espessura mdia e das suas coordenadas de inicio e fim. Cada novo fragmento
encontrado colocado na lista que est ordenada por ordem crescente da posio vertical
dos fragmentos.
Um fragmento fechado e retirado da lista quando em dada coluna da imagem no existe
um segmento contguo (fim ou a interrupo numa linha), ou o segmento contguo a esse
fragmento tem um comprimento superior a MAXCOMP (possivelmente a interceco da linha
com um objecto). Veremos mais frente o seguimento dado aos fragmentos retirados da
lista.
O valor de MAXCOMP no incio deste processo, muito superior ao valor esperado da
espessura das linhas, e consequentemente dos seus fragmentos constituintes. No entanto
ele ajustado dinamicamente, em funo da espessura mdia dos fragmentos que vo
sendo encontrados (maioritriamente fragmentos de linhas) de tal forma a que o seu valor
seja sempre sensivelmente superior espessura mdia das linhas, localmente.
26
D E T E C O D AS L I N H AS D O S P E N T AG R AM AS
Consegue-se assim:
Eliminar fragmentos horizontais pertencentes a outros objectos da imagem, de
maior espessura.
;
Construo de linhas
A reconstituio das linhas feita de forma anloga utilizada na contruo dos fragmentos.
Cada fragmento encontrado ento inserido numa nova lista que mantm entradas para
todas as linhas reconstruidas at ao momento. Para cada novo fragmento feito um teste de
colinearidade para determinar se j existe uma linha que poder conter esse fragmento, ou
se o fragmento o inicio de uma nova linha.
Cada entrada nesta lista contm os parmetros a e b da equao da recta (y = a*x + b) da
linha respectiva e os campos que permitem recalcular aqueles parmetros, pela aproximao
dos Mnimos Quadrados, cada vez que um novo fragmento agregado. Existem ainda
campos que mantm o comprimento da linha, os seus pontos extremos, a espessura mdia e
o nmero de fragmentos associados.
O teste de colinearidade processa-se do seguinte modo:
Cada linha candidata projectada na direco do segmento, calculando-se ento
a menor distncia (d) desta recta ao ponto mdio do fragmento considerado.
;
Definiu-se ento um coeficiente de colinearidade com base nos valores calculados, e ainda
em funo do comprimento do fragmento e da espessura da linha:
COEFcool = (a * comprimento do fragm. + d / 2 ) / espessura
Considera-se que um fragmento colinear com a linha sempre que:
COEFcool < 1
Este coeficiente foi definido com base em testes feitos em vrias imagens de pautas musicais
sendo por isso dependente do contexto. Alguns autores, referem testes de colinearidade
entre segmentos de recta em que a distncia longitudinal entre os segmentos afecta o grau
de colinearidade, no entanto essa restrio no pode aqui ser aplicada pois as
descontinuidades nas linhas so provocadas pela sobreposio de smbolos de tamanho
27
D E T E C O D AS L I N H AS D O S P E N T AG R AM AS
imprevisvel, sendo por isso muito varivel a distncia que separa os extremos de uma linha,
do seu prximo fragmento constituinte.
Assim, quanto maior a diferena entre os declives, menor dever de ser a distncia da
projeco da recta ao ponto mdio do fragmento. De forma inversa, se a distncia ao ponto
mdio assinalvel, o fragmento dever ter um declive prximo do da recta projectada. De
referir ainda que quanto mais longo o fragmento, maior ser o peso da diferena de
declives, no coeficiente de colinearidade.
Para maior clareza sobre o significado e a influncia dos parmetros referidos ilustramos em
seguida os dois casos extremos de colinearidade em relao aos parmetros d e a.
d
a = 0 , d = 2 * espessura
d = 0 , a = 1 / comprimento do segmento
Nota: as dimenses da figura foram propositadamente exageradas
Seleco de linhas
Do processo de reconstituio de linhas anteriormente descrito, resulta uma lista de linhas,
candidatas a formar os pentagramas, no entanto surgem tambm outras linhas que devero
ser ignoradas. Estas ltimas surgem essencialmente de duas situaes:
Linhas Suplementares
A presena de vrias linhas suplementares pode induzir o aparecimento de uma linha,
formada por todos esses segmentos. A existncia de espaos em branco entre os vrios
segmentos de uma linha, no um critrio seguro de eliminao: as linhas verdadeiras
podem apresentar interrupes, e as sequncias de linhas suplementares podem surgir sem
espaos entre elas (ver figura).
Notao auxiliar
So exemplo as linhas horizontais de repetio (exemplo da figura), indicao de quadratura,
ou at marcas de crescendo mais longas.
28
D E T E C O D AS L I N H AS D O S P E N T AG R AM AS
A seleco das linhas dos pentagramas levada a cabo por um processo iterativo.
Prviamente, feita uma estimativa do espao mdio entre linhas recorrendo a um
histograma das distncias entre linhas, duas a duas e trs a trs. Com esta medida estimada
procuram-se formar arranjos de 5 linhas aproximadamente equidistantes, sendo atribuido a
cada arranjo uma pontuao em funo da varincia de vrios parmetros caractersticos:
Distncias entre as linhas
<
<
29
SEPARAO DE OBJECTOS
Objectivo
Separar ou isolar todos os objectos / smbolos da imagem, que na sua maioria esto
sobrepostos s linhas dos pentagramas, utilizando para o efeito a informao sobre a
localizao, j determinada, daquelas linhas.
Definir o contorno de cada objecto individual.
Procedimento
Separao dos Objectos - Remoo das Linhas
A abordagem mais imediata a este problema, seria a de percorrer a matriz de segmentos
identificando e removendo literalmente os elementos da matriz da imagem pertencentes s
linhas, deixando apenas a informao relativa aos segmentos constituintes dos objectos,
procedendo-se ento construo dos contornos correspondentres. No entanto, no existe
qualquer vantagem em separar estes dois processos: se possivel identificar os segmentos
que constituem as linhas, ento possvel apenas ignor-los durante o processo de
construo dos contornos, evitando assim uma segunda passagem pela matriz de segmentos
e o processamento adicional da remoo daqueles elementos na matriz da imagem. Esta
opo foi intencional pois permite deixar a informao da imagem intacta; posteriormente
alguns algoritmos de reconhecimento recorrero a projeces
de pequenas reas
localizadas da imagem, nas quais surgiro projectadas tambm as linhas, que sero teis
como pontos de referncia na anlise da projecao.
espessura mdia
linha
compr. segmento
distncia
A linha recta representada determinada pela sua equao da recta conhecida, permitindo
calcular a distncia ao ponto mdio de um segmento. A espessura mdia das linhas dos
pentagramas tambm j um dado conhecido, e representa a espessura mdia de todas as
linhas de cada pentagrama (preve-se assim a possibilidade de diferentes pentagramas terem
diferente espessura mdia das suas linhas, facto que embora sensvel ocorre na prtica).
30
S E P AR A O D E O B J E C T O S
2*espessura
Curvatura mxima admissvel numa linha
Da anlise efectuada em vrias pautas musicais durante testes, podemos afirmar que uma
pauta que apresente estas duas formas de rudo com valores superiores aos apresentados,
uma pauta graficamente distorcida, em mau estado, ou mal impressa. Convem lembrar que
este projecto contempla apenas o reconhecimento de pautas impressas (por meios
mecnicos), o que pressupe critrios mnimos de qualidade, que quantificmos como aqui,
ao longo de todo o projecto.
31
S E P AR A O D E O B J E C T O S
Para tornar mais sensvel o processo de separao, seria necessria informao contextual
muito complexa e detalhada, alm disso indisponvel nesta fase do processamento da
imagem.
Uma primeira abordagem possvel seria a de tornar o processo de separao mais selectivo
nas imediaes de objectos. Assumindo que seria possvel detectar essa proximidade,
verificamos no entanto que um aumento de selectividade se tornaria to indesejvel como
vantajosa. A figura seguinte ilustra um caso, entre muitos, em que a remoo das seces
das linhas no interior de um objecto ou entre objectos muito prximos seria comprometida.
Antes da separao
Separao normal
Separao selectiva
Note-se que, tal como j foi referido, a espessura das linhas tende a aumentar nas
imediaes dos smbolos (devido, possivelmente a um maior volume de tinta concentrado
nessas areas, durante a impresso...).
S E P AR A O D E O B J E C T O S
filhos
irmo
irmo
A matriz de segmentos da imagem lida coluna a coluna, da esquerda para a direita e tal
como quando da deteco das linhas, iremos procurar segmentos verticais adjacentes
horizontalmente, que formem os objectos. Agora, apenas os segmentos no pertencentes a
linhas dos pentagramas so considerados (testando-se cada pelo processo j descrito).
Abertura de um contorno
Sempre que surge numa coluna um segmento vertical que no tenha nenhum segmento
contguo da coluna anterior, um novo contorno externo iniciado, etiquetado com um nmero
sequencial (identificador), e os seus extremos abertos so guardados numa lista de
contornos abertos.
ultima coluna lida
33
S E P AR A O D E O B J E C T O S
2
1
Fecho de um contorno
Quando ocorre o fecho de um contorno, os seus extremos so unidos e retirados da lista de
contornos abertos. Antes ainda, inspecciona-se qual o contorno pai que o envolve, e registase o seu nmero identificador. O contorno ento colocado numa lista de contornos
fechados, e recolhe dessa lista todos os contornos j existentes cujo identificador do pai o
do contorno agora inserido. Importa salientar que nenhum contorno pode fechar sem que
todos os seus filhos o tenham j sido.
2
1
3
4
34
S E P AR A O D E O B J E C T O S
2
1
3
35
Procedimento
Teremos que calcular o valor da curvatura em todos os pontos do contorno. Para esse efeito
recorremos a um desenvolvimento matemtico conhecido que permite calcular a curvatura
num ponto em funo das derivadas de primeira e segunda ordem das posies X e Y, em
ordem a t, onde dt representa um deslocamento ao longo do contorno.
k (t ) =
( x '(t )
+ y ' (t )
-1
O valor de K
Dado o carcter discreto dos valores (x,y) de um contorno (limitado matriz de pontos da
imagem) no possvel derivar directamente os contornos pelo facto de que pequenas
oscilaes, introduziro grandes variaes no valor das derivadas. Para contornar este efeito
procederemos a um pr-alisamento dos contornos reduzindo substancialmente essas
oscilaes, e efectuaremos depois uma diferenciao ponderada por um pulso gaussiano.
Pr-alisamento
Duas operaes de alisamento so efectuadas sobre os contornos. Nas figuras seguintes as
linhas a tracejado representam o contorno aps o alisamento.
Eliminao de saltos
Eliminao de escadas
Com este pr-alisamento possvel eliminar grande parte do rudo de alta-frequencia, mais
evidente nas seces rectilneas dos contornos.
D I V I S O D E C O N T O R N O S E M P R I M I T I V AS G R F I C AS
g (t ) =
2
e 2
dx (t ) = g (i ) [ x ( t i ) x ( t i 1) + x ( t + i + 1) x ( t + i )]
i =
Finalmente calcula-se o valor da curvatura a partir dos valores das derivadas calculados. A
utilizao do pulso gaussiano na diferenciao provoca um alisamento no grfico da
curvatura, eliminando as variaes mais abruptas. O parmetro da funo gaussiana
permite regular esse alisamento; um aumento de provoca uma diminuio das altas
frequncias mas simultaneamente uma perda de resoluo no grfico da curvatura. O valor
adoptado neste projecto fixo ( = 6 ) e relaciona-se com as caractersticas dos smbolos
musicais: procurou-se obter o mximo alisamento sem perda do detalhe necessrio
identificao das particularidades daqueles smbolos. Refira-se ainda que o valor escolhido
apresenta alguma robustez; uma variao unitria em torno do valor adoptado (entre 5 e 7),
no afecta o processo de reconhecimento.
A
P
MAX_VAR_K
Os pontos do contorno com maior votao sero os centros (relativamente curvatura) dos
maiores segmentos com curvatura constante isto inferior a MAX_VAR_K.
37
D I V I S O D E C O N T O R N O S E M P R I M I T I V AS G R F I C AS
curvatura mdia
=
moldura
=
D I V I S O D E C O N T O R N O S E M P R I M I T I V AS G R F I C AS
Aps a classificao das junes entre cada par de primitivas obtm-se nova sequncia:
VERTICAL , ANGULO180 , VERTICAL , ANGULO90 , ARCO , ( ? ) , ARCO
Neste exemplo apenas uma juno no foi classificada; trata-se de uma juno suave entre
dois ARCOs de igual sinal, sendo por isso fundida com as duas primitivas adjacentes
resultando finalmete a sequncia:
VERTICAL , ANGULO180 , VERTICAL , ANGULO90 , ARCO
No final de todo este processo obtm-se para cada contorno um anel de primitivas grficas
que o representa.
39
40
PR-CLASSIFICAO DE OBJECTOS
A classificao e o reconhecimento dos objectos musicais no recorre a um mtodo genrico
nico, vlido para todos. Pelo contrrio, a existncia de objectos de mltiplas dimenses e
de objectos compostos, obriga utilizao de procedimentos diversos com algortmos algo
complexos e que fazem uso extensivo do conhecimento do domnio.
Esta especificidade dos algortmos de reconhecimento refora a ideia de que necessrio
dividir os objectos em classes que permitam a canalizao para algortmos dedicados.
Procurou-se dividir os objectos em grupos ou classes com caractersticas globais
semelhantes. Esta pr-classificao no est relacionada com a diviso lgica dos smbols
musicais, embora nalguns casos haja coincidncia.
Os critrios de pr-classificao so os seguintes:
rea da moldura envolvente do objecto
>
>
41
P R C L AS S I F I C A O D E O B J E C T O S
N
N
Objecto com:
Altura > Comprimento ?
Acidente Simples ?
S
N
Clave de Sol ?
S
N
Clave de F ?
S
N
Clave de D ?
S
N
Pausa de
Semnima ?
S
N
Diviso de
Compasso ?
S
N
Pausa com
Cauda ?
S
N
Candidato a
Notas com Haste ?
Candidato a Ligadura ?
N
Testes de Pr-Classificao:
Tamanho
Propores
N de Contornos Filhos
Reconhecimento
Lixo
O encadeamento dos vrios mdulos foi escolhido de forma a minimizar a entrada de
smbolos em classes erradas. De qualquer forma os algortmos de reconhecimento so
bastante estanques, permitindo rejeitar a grande maioria das entradas inadvertidas,
reenviando os objectos para a classe seguinte.
42
Noutros casos a forma e/ou a posio no podem variar, como o caso das claves, e de
todas as alteraes. Existem tambm smbolos em que a forma varia mas dentro de um
padro definido, como so as pausas e as notas de durao igual ou inferior a uma colcheia.
43
Procura-se assim tanto quanto possvel, utilizar este conhecimento nos mdulos de
reconheciento com o objectivo de os tornar mais robustos, e acima de tudo aumentar a taxa
de reconhecimento global.
...
Claves
Acidentes
Divises de compasso
...
Pontos de aumentao
Forma
Sequncia de Primitivas
Hastes
etc...
Note-se que na maioria dos casos so analizados os vrios parmetros de cada primitiva que
constitui uma dada forma geomtrica. Por exemplo, a mesma sequncia de primitivas
[VERTICAL, ANGULO_180 , VERTICAL] , poderia representar uma extremidade vertical em
forma de seta ou uma extremidade rectilnea, diferindo apenas no declive de ambos os
segmentos verticais.
Projeces localizadas
Nos casos de objectos frequentemente fragmentados (especialmente devido sobreposio
em linhas), procurou-se detectar pontos chave desses objectos no afectados, procedendose em seguida a uma reconstruo das partes do objecto hipoteticamente destruidas ou
separadas. Para este efeito recorreu-se a projeces de pequenas reas localizadas da
imagem. As projeces no so mais do que histogramas de pontos pretos (bit = 1), de
linhas (projeces verticais) ou colunas (projeces horizontais) de uma rea da imagem
seleccionada. As projeces so calculadas a partir da matriz de segmentos, que
recordamos, mantm toda a informao da imagem original.
As projeces so ento analizadas de acordo com cada caso particular, em parmetros
como:
rea projectada versus rea da projeco
@
Nmero de blocos distintos e em cada bloco: rea, largura e altura dos blocos
@
Mdulos de Reconhecimento
Os mdulos de reconhecimento em cada classe de objectos no so mais do que um
aplicao conjunta de vrias das tcnicas apresentadas, baseada, tal como j foi referido, no
seu contexto musical, e nas suas caractersticas grficas, aps todo o pr-processamento. O
carcter complexo e particular dos algortmos de cada mdulo no justifica pois, a sua
descrio detalhada e exautiva. Em todo o caso apresenta-se em seguida, uma descrio
sucinta de um destes mdulos, talvez o mais ilustrativo da conjugao das vrias tcnicas de
reconhecimento e/ou extraco de eventos.
45
Grupos de notas
Percorre-se a lista de primitivas grficas detectando:
o maior segmento horizontal que ir determinar, quando comparado com a
moldura do objecto, a direco das notas.
A
Notas isoladas
Percorre-se a lista de primitivas grficas detectando uma sequncia particular que identifique
o extremo da haste oposto s cabeas de notas. Consoante o tipo de sequncia, podemos
fazer uma pr-classificao no que respeita existencia de caudas. Isto ir no s
determinar a procura das caudas como tambm a procura ou no de cabeas brancas (uma
haste com caudas no pode ter cabeas brancas como notas.
Tendo a orientao da nota, dada pelo passo anterior, as caudas e notas so detectadas
mais uma vez atravs de projeces verticais e sua classificao.
46
INTERPRETAO
A interpretao consiste na transformao de um grupo de smbolos musicais isolados,
prviamente reconhecidos, no seu significado musical com o objectivo de criar um ficheiro de
sada que possa ser utilizado por editores e reprodutores musicais. Este processo est
dividido nas seguintes etapas sequenciais:
classificao de notas
B
classificao de alteraes
B
atribuio de alteraes
B
ordenao de eventos
B
pr-processamento de eventos
B
separao de vozes
B
interpretao de vozes
B
Recordamos que nesta fase do processo, dispomos para cada pentagrama de:
uma lista com todos os eventos detectados e respectivas caractersticas
estruturais
B
Classificao de notas
Objectivo
A classificao de uma nota tem por objectivo determinar a sua posio relativa no
pentagrama no que se refere linha ou espao entre linhas a que pertence. Esta
classificao feita em funo das coordenadas da nota e das coordenadas das linhas que
constituem o pentagrama.
Relembramos que nesta fase ainda no possivel determinar a altura da nota pois ela
depende do contexto musical no momento em que ocorre, nomeadamente no que se refere
clave.
Mtodologia
Esta classificao ser feita atravs da atribuio de um nmero que representa a linha ou
espao entre linhas, de acordo com a seguinte figura:
47
I N T E R P R E T A O
linha -6
espao -5.5
linha 0
linha 4
espao 9.5
linha 10
Depois de detectado o ponto mdio da nota e feita uma comparao com as linhas superior e
inferior do pentagrama, uma de duas situaes pode ocorrer:
Eficcia
Este mtodo baseia-se numa aproximao das linhas do pentagrama a segmentos de recta.
Isto nem sempre verdade como j foi dicutido anteriormente. No limite, e tendo em conta a
tolerancia mxima admitida que se traduz numa distancia ao ponto mdio do segmento de
recta igual a 2 * espessura mdia da linha, que regra geral igual a 0.5 * espao mdio entre
linhas, causaria um erro traduzido pela atribuio da nota ao espao/linha adjacente. No
entanto, este caso raro, e os resultados no que se refere a erros causados por este
problema so bastante bons.
Em relao s notas pertencentes a linhas/espaos suplementares, estamos a partir do
principio que estas esto separadas por uma distancia mdia igual distancia mdia entre as
linhas do pentagrama. Isto em geral vlido, apenas introduzindo ocasionalmente erros em
notas situadas acima da 2 linha suplementar superior e abaixo da 2 linha suplementar
inferior.
Outro factor que pode introduzir erros no processo de classificao de notas tem haver com
erros na determinao da moldura da mesma, aquando do processo de reconhecimento,
normalmente derivados de notas imperfeitas. No entanto, o nmero de erros derivados deste
factor no significativo.
48
I N T E R P R E T A O
Classificao de alteraes
Objectivo
A classificao das alteraes refere-se apenas aos acidentes e pontos de aumentao, e
tem por objectivo a atribuio do nmero de linha/espao do pentagrama a que pretencem,
com o objectivo de facilitar a posterior atribuio dos mesmos s notas pois situam-se na
mesma linha.
Metodologia
O mtodo utilizado para a classificao das alteraes em tudo semelhante ao utilizado
para as notas.
De referir no entanto, que as coordenadas verticais associadas aos acidentes, no so em
geral as suas coordenadas reais, mas sim as coordenadas que definem a que linha/espaco
eles pertencem, de modo a que se possa fazer a classificao atravs do seu ponto mdio.
Atribuio de alteraes
Objectivo
Este passo serve para associar as alteraes s notas correspondentes, e separar os
acidentes que possam fazer parte de uma armao de clave.
Acidentes
Este tipo de alteraes, onde se encontram os sustenidos, bemois, bequadros e sustenidos
duplos, esto situadas esquerda da nota a que devem ser associadas.
Assim, feita uma pesquisa na tabela que contm todas as notas reconhecidas para
encontrar aquela que, em relao ao acidente:
pertena mesma linha/espao
F
Caso exista uma nota nestas condies, e que a sua distancia ao acidente seja menor que
uma distancia mxima prviamente definida (abaixo descrita), a atribuio feita.
Caso contrrio, a pesquisa repetida mas desta vez considerando todas as notas situadas
na linha/espao adjacentes para colmatar eventuais falhas na correcta determinao do
nmero de linha/espao quer da nota quer do acidente, sendo esta ltima a mais frequente
devido a situaes do tipo descrito na figura seguinte.
49
I N T E R P R E T A O
Por outro lado, este valor tem de ser suficientemente grande para que os mais distantes das
notas, como nos exemplos da figura seguinte, sejam correctamente atribudos.
Armaes de clave
Os acidentes que no sejam atribudos muito provavelmente pertencero a armaes de
clave. Assim, cada acidente ser transformado num evento do tipo <SIGN>, que
posteriormente ser tratado para a criao das armaes de clave.
Pontos de aumentao
A atribuo de pontos de aumentao em tudo semelhante atribuio de acidentes com
a unica diferena a residir no facto de os pontos se encontrarem direita das notas a que
esto associados.
Em relao aos pontos no atribudos, eles sero conservados para posteriormente (a seguir
fase de ordenao de eventos) ser feita uma tentativa de atribuo s pausas.
Outros smbolos
Em relao a todos os outros smbolos musicais no reconhecidos neste projecto, a sua
atribuo seria feita da seguinte forma consoante o seu tipo:
50
I N T E R P R E T A O
Ordenao de eventos
Descrio
A finalidade deste passo, a transformao de uma lista desordenada de eventos numa
sequncia de eventos ordenada temporalmente (coordenadas horizontais crescentes).
A possibilidade de existencia de vrias vozes num pentagrama obriga a que esta ordenao
no se resuma criao de uma nova lista unidimensional. Assim, temos que prever a
existencia de eventos simultneos (coordenadas horizontais semelhantes), criando para tal
uma estrutura bidimensional.
A estrutura slot
Na escrita musical convencional, no existem pentagramas representando mais do que trs
vozes concorrentes, sendo este o nmero mximo de eventos que podem ocorrer em
simultneo.
Assim, definimos uma nova estrutura que representa um instante temporal, ou seja, em
termos de coordenadas horizontais do pentagrama um intervalo pequeno onde todos os
eventos que estejam a contidos sejam executados em simultneo, e com capacidade para
conter at trs eventos. Esta estrutura ser designada por slot.
O objectivo deste processo ento a criao de uma sequncia de slots, ordenados
temporalmente, contendo referencias aos eventos que esto situados nesse instante.
Eventos intemporais
Ser importante referir que os eventos intemporais apenas podem existir isoladamente, no
podendo portanto coexistir temporalmente com outros eventos sejam eles intemporais ou
no. Isto implica que um slot contendo um evento intemporal apenas pode conter esse
evento.
Metodologia
O mtodo utilizado para o ordenamento dos eventos baseia-se na construo de uma lista
ligada de slots atravs de uma pesquisa sequencial lista construda at ento, de onde
salientamos os dois casos possiveis:
Eventos intemporais
No caso do evento pertencer a este tipo, ser sempre criado um novo slot, e a pesquisa fazse at encontrar o local onde ele deve ser inserido.
51
I N T E R P R E T A O
Outros eventos
Neste caso, feita uma pesquisa sequencial procura do slot correspondente s
coordenadas do evento. Caso ele exista o evento a introduzido. Caso contrrio, criado
um novo slot e introduzido na posio correcta.
Eficcia
O nico erro que poder ocorrer neste passo tem haver com a possibilidade do slot
correspondente a um evento j estar cheio, caso em que um dos eventos ser eliminado. De
notar que este caso apenas pode surgir se prviamente tiver ocorrido um erro no processo de
reconhecimento, e tiver sido detectado um evento inexistente, o que pouco provvel.
Pr-processamento de eventos
Durao de um evento
nesta fase do processo que vo ser interpretadas as caracteristicas estruturais dos eventos
para determinar a durao de cada um.
Assim, a cada evento ser atribudo um inteiro que representa a sua durao em relao a
metade da durao de uma trifusa (nota com 5 caudas). Esse inteiro, para o caso das notas
com durao inferior a uma seminima, ser calculado a partir do nmero de tails (n>0), e
dado pela seguinte expresso:
d=
256
2+ n
durao
semibreve
256
minima
128
seminima
64
Depois deste valor inicial para a durao ser determinado, necessrio fazer uma correco
no caso de haver pontos de aumentao atribudos. Assim a durao final dada consoante
o nmero de pontos de aumentao por:
1 ponto de aumentao:
G
d final = d +
d
2
2 pontos de aumentao:
52
I N T E R P R E T A O
d final = d +
d d
+
2 4
Nmero de vozes
Paralelamente com a atribuo da durao dos eventos, determinado o nmero de vozes
existentes no pentagrama, que igual ao nmero mximo de eventos existentes num slot.
Separao de vozes
Descrio
A necessidade de fazer uma separao das vozes que contituem um pentagrama prende-se
com o facto de, regra geral, os formatos de ficheiros musicais assim o exigirem. Em
particular, o formato do editor de msica SCORE impe que cada pentagrama seja descrito
como uma sequncia de eventos, permitindo no entanto sobreposies destas sequencias,
representando vozes concorrentes. Uma descrio mais detalhada deste formato,
nomeadamente no que respeita a esta caracterstica encontra-se em apndice.
A separao real de vozes concorrentes num pentagrama, um problema de muito dificil
resoluo pois seria necessrio entrar em linha de conta com uma srie de regras de
composio que por um lado esto fortemente ligadas s vrias correntes musicais logo,
variando bastante de estilo para estilo, e por outro no so rigidas, podendo ser violadas por
qualquer um. Este seria um tema muito interessante de explorar, mas completamente fora do
ambito deste projecto.
Assim, optmos por fazer uma separao que no sendo correcta em termos do conceito
musical de voz, nos permite passar toda a informao necessria edio e reproduo
musical do pentagrama.
Em termos de reproduo musical, a separao de vozes apenas teria que levar em linha de
conta a durao das notas, ou seja, a nica regra teria haver com o facto de que enquanto
53
I N T E R P R E T A O
durar um evento numa voz, mais nenhum lhe pode ser atribudo. No entanto, porque a edio
de msica um factor a que ns sempre demos relevo, e porque neste campo o formato do
SCORE impoe algumas restries, ser necessrio introduzir novas regras como sejam :
atribuir mesma voz eventos que pretenam a um grupo de notas comum.
W
A segunda regra apenas vivel no que respeita a ligaduras de durao pois elas ligam
sempre duas notas consecutivas. Quanto aos outros tipos de ligaduras, e especialmente as
de expresso, o seu processamento ser praticamente impossvel pois implicaria uma
separao real das vozes.
Importa referir que o formato SCORE apenas permite ligar e agrupar notas pertencentes a
uma mesma voz.
regra do tempo: caso contrrio, ele atribudo voz com menor durao at esse
ponto.
W
regra por defeito: caso todas as vozes tenham a mesma durao, ele atribudo
aleatriamente.
W
Outra das caractersticas do formato SCORE tem haver com o facto de as vrias vozes de
um mesmo pentagrama terem que estar sincronizadas. Assim, e para que dois eventos
sejam colocados na mesma coordenada horizontal, necessrio que a soma da durao dos
eventos precedentes seja igual.
Assim, e para colmatar falhas surgidas no reconhecimento de eventos (eventos no
reconhecidos, eventos com durao incorrecta), e para resolver o problema da mtrica
incompleta, de modo a que o grafismo da pauta se mantenha semelhante ao original, ser
necessrio aquando da separao de vozes, manter um sincronismo entre elas. Para isso,
definimos um novo tipo de evento que designaremos por pausa invisvel, e caracterizado por
uma durao, ausencia de som, e como o nome indica, invisvel. Este evento ser introduzido
numa voz sempre que seja detectada a falta de um evento.
Pontos de sincronismo
Para que se mantenha um sincronismo entre as vozes, necessrio definir alguns pontos
nos quais sero testadas as duraes das vozes para determinar a necessidade de insero
de pausas invisiveis.
Estes pontos so:
eventos intemporais: o facto de um evento intemporal no poder existir
simultaneamente com mais nenhum evento, implica que sempre que este caso
acontea, a durao de todas as vozes tenha que ser igual. Assim, todas as vozes
sero sincronizadas pela de maior durao, atravs da insero de pausas
invisiveis se necessrio, antes de ser feita a atribuio do evento.
W
eventos intemporais: aps terem sido seleccionadas as vozes e antes de ser feita
a atribuio, deve ser determinado o valor da durao da voz mais curta, de entre
as seleccionadas, e sincronizar todas as vozes com durao inferior a este valor.
54
I N T E R P R E T A O
Metodologia
Assim o mtodo utilizado consiste na criao de um nmero de listas ligadas igual ao nmero
de vozes, onde sero introduzidos no fim das mesmas os eventos retirados dos slots, e as
pausas invisiveis sempre que necessrias para manter o sincronismo.
De notar que os eventos intemporais devem ser multiplicados e introduzidos em todas as
vozes para que a interpretao de cada uma delas possa ser feita de uma forma
independente das restantes, e porque o formato do SCORE
requer que estes eventos
sejam introduzidos em todas as vozes.
No fim deste processo obtemos, para cada voz, uma lista ligada de eventos pronta a ser
interpretada para qualquer formato musical independentemente das restantes vozes.
Eficcia
Exceptuando o problema dos smbolos atribuidos a notas no consecutivas como seja o caso
de algumas ligaduras, esta separao de vozes, apesar de no ser musicalmente correcta,
permite transferir para qualquer formato musical, e particularmente para o SCORE por ser o
mais exigente, toda a informao necessria correcta edio e reproduo musicais.
Interpretao de vozes
Objectivo
Por interpretao de vozes referimo-nos ao processo pelo qual a lista de eventos lida e so
executadas as seguintes tarefas:
38
26
32
30
a = ((c 2l ) + 2) mod(7)
o = 48 +
c 2l
7
55
y.
I N T E R P R E T A O
0
1
2
3
4
5
6
A L
B S
C D
D R
E Mi
F F
G Sol
uma armao de clave apenas pode existir a seguir a um evento do tipo: diviso
de compasso, clave ou armao de clave.
X
eventos do tipo pausas: dada uma entrada no campo pitch e uma no campo
rythm.
Durante este processo, criada uma tabela com referencia primeira e ultima nota de cada
grupo. Esta tabela ser posteriormente lida para probuzir o campo beams.
56
I N T E R P R E T A O
Os restantes dois campos no esto a ser utilizados de momento. Eles serviro mais tarde
para introduzir referencias s ligaduras e outros smbolos que possam vir a ser reconhecidos.
Perda de Informao
O formato Midi vocacionado para a descrio de eventos temporais, no permitindo registar
a maior parte da informao grfica reconhecida como sejam as barras sobre notas, direco
das hastes, divises de compasso, etc...
I N T E R P R E T A O
58
RESULTADOS E CONCLUSES
Para a avaliao final deste trabalho recolhemos arbitrariamente um conjunto de 17 pautas
com diferentes caractersticas e graus de complexidade. Em anexo encontram-se vrias
folhas, trs por cada imagem de teste que incluem cpia da imagem original e a impresso
do ficheiro SCORE de sada. Para cada imagem consta ainda uma referncia aos tempos
parciais e total de processamento e a taxa de reconhecimento resultante.
Eficcia
Critrios de avalio
Antes de se poder tirar concluses em relao aos resultados do reconhecimento das pautas,
foi necessrio estabelecer uma forma de quantificao dos mesmos.
Devido complexidade da escrita musical, a taxa de reconhecimento no se resume, em
nosso entender, a um critrio simples de presena/ausncia de um smbolo; necessrio
tomar em linha de conta vrias caractersticas de cada objecto de forma a obter um valor que
possa representar essa mesma taxa de reconhecimento. Assim e considerando apenas os
smbolos pertencentes ao universo reconhecido pelo RIEM, definimos o seguinte conjunto de
factores de avaliao:
Taxa de reconhecimento de eventos (a)
Z
Anlise de resultados
Com os critrios de avaliao adoptados, e para o universo de pautas testado, obtivmos
uma taxa de reconhecimento mdia de 88 %. Consideramos que estes resultados
excederam largamente as nossas expectativas.
A fragmentao de objectos continua a ser uma das principais causas de omisses ou
reconhecimento incorrecto de objectos. Embora tenham sido adoptadas algumas medidas
para minimizar estas falhas, continua a ser complexo lidar com os casos mais srios de
fragmentao. Pensamos no entanto que uma abordagem completa a este problema (ex:
tcnicas de anlise de nuvens de fragmentos) no poderia inserir-se num projecto vasto
como este, duma forma meramente complementar.
59
R E S U L T AD O S E C O N C L U S E S
Eficincia
Tempos relativos
Durante testes realizados nas vrias pautas obtiveram-se os tempos de execuo parciais
para cada um dos principais mdulos do projecto. Determinaram-se ento as mdias
percentuais do tempo total de execuo:
[
14%
4%
Isolamento de objectos
15%
Reconhecimento de objectos
67%
Interpretao
Tempos absolutos
O tempo absoluto de reconhecimento e interpretao de uma pgina de msica varia de
acordo com a sua complexidade. No conjunto de pautas de teste anexas referido o tempo
absoluto de processamento de cada uma.
A ttulo de referncia, a imagem mais complexa testada ocupando a totalidade de uma
pgina A4 demoro menos de 100 segundos num PC-Intel 486 DX2, 66Mhz.
A converso da informao contida na imagem, em sucessivos passos, e para niveis mais
abstractos, permite eliminar rapidamente a redundncia existente neste tipo de imagens,
obtendo-se por isso nveis de performance bastante razoveis.
Concluses finais
O sistema aqui apresentado o resultado da investigao, e experimentao possvel, numa
rea ainda pouco ou nada estudada, entre ns. No decorrer do seu desenvolvimento, foram
vrias as abordagens tentadas para cada um dos mdulos concretizados, tendo-se
60
R E S U L T AD O S E C O N C L U S E S
abandonado, e refeito vrias vezes algumas das fases do plano inicialmente idealizado.
Ficou a sensao de que alguns destes mdulos, poderiam ser desenvolvidos no mbito de
um nico projecto, ao longo de todo um ano.
Um projecto desta natureza deveria por isto ser alvo de alguma continuidade no sentido de
aperfeioar e ou expandir alguns dos conceitos nele introduzidos, a outras reas do
tratamento musical.
Nesta primeira abordagem, face ao carcter experimental inicialmente incutido neste
projecto, e considerando a relao eficcia/eficincia do sistema desenvolvido, pensamos
que os objectivos propostos foram ultrapassados.
61
BIBLIOGRAFIA
Processamento e Reconhecimento de Imagem
AGUI, Takashi, Masayyuri Nakajima, Tae K. Kim, Recognition and Representation of
Korean Characters by Tree Grammars
1979, IEEE, PAMI-1, n3, Julho
AL-YOUSEFI, H., S.S. Uopa, Recognition of Arabic Characters
1992, IEEE, PAMI-14, n8, Agosto
BAIRD, H.S., Bunke, H., Yamamoto, K. Structured Document Image Analysis
1992, Springer-Verlag
BERGEVIN, Robert, Martin D. Levine, McGill University, Canada, Extraction of Line
Drawing Features for Object Recognition
1990, 10th ICPR Proceedings, June 16-21
BUVRY, M., , S. Zagba, C. Krey, Segmentation Improvement Using Connected Lines
Matching in Stereovision
1992, ICARCV92 Proceedings, Vol. 1, September 16-18
FU, King S., Syntactic Pattern Recognition and Applications
1982, Prentice Hall
GONZALEZ, Rafael C., Michael G. Thomason, Syntactic Pattern Recognition, an
Introduction
1978, Addison-Wesley Publishing Company
GU, X., Wang Q.R., Suen C.Y., Application of Multilayer Decision Tree in Computer
Recognition of Chinese Caracters
1983, IEEE, PAMI-5, n1, Janeiro
JAIN, Anil K., University of California, Davis, Fundamentals of Digital Processing,
1978, Prentice Hall
JAMES, Mike, Pattern Recognition
1988 John Wiley & Sons, Inc.
KULTANEN, Pekka, Lei Xuf, Erkki Oja, Lappeenranta University of Technology, Finland,
Randomized Hough Transform
1990, 10th ICPR Proceedings, June 16-21
LOPES, Paulo, Eugnio Oliveira, DEEC, Universidade do Porto, Contributions to Increase
Efficiency on the Hough Transform,
62
B I B L I O G R AF I A
Interpretao Musical
FIRMINO, Jos, Leituras Musicais
STEPHAN, Rudolf, Musica - Enciclopdia Meridiano Ficher
1978, Agosto, Editora Meridiano
VIEIRA, Ernesto,Teoria da Msica
28 Edio, Valentim de Carvalho
Manuais Tcnicos
63
APENDICE 1 -
64
Pr-Codificao da Imagem
Pr-Classificao de Objectos
Encaminhamento para
Mdulos de Reconhecimento
\
Reconhecimento de Objectos
Listas de Eventos
`
TR
TN
BP
BP
BP
BP
BP
BP
BP
LA
Gerao de Eventos
LE
c
a
Ver fluxograma
na pgina seguinte
Ficheiro SCORE
Ficheiro MIDI
65
AP E N D I C E 2 - F L U X O G R AM A D O P R O J E C T O P AS S O - A- P AS S O
Interpretao de Eventos
Classificao de Notas
e
LE
TR
TN
BP
BP
BP
BP
BP
BP
BP
SIGN
SIGN
i
k
Classificao de Alteraes
i
Atribuio de Alteraes
M
TR
SIGN
R
N
SIGN
LS
d
f
g
Ordenao de Eventos
TN
h
BP
BP
BP
BP
BP
BP
BP
Pr-Processamento de Eventos
d
TN
BP
BP
BP
BP
BP
BP
BP
1v
TR
SIGN
2v
TR
SIGN
RI
f
g
Separao de Vozes
i
h
Interpretao de Vozes
66
APENDICE 3 -
O SCORE talvez uma das mais potentes ferramentas de edio musical. No sendo um
programa de fcil utilizao, tem a grande vantagem de permitir a introduo de pautas de
msica atravs da leitura de um ficheiro de texto preservando toda a informao em termos
de edio musical.
Neste ficheiro, cada pentagrama descrito pelos seguintes campos:
Pitch stage
Este campo serve para dar entradas das notas (tom e oitava), pausas, claves,
armaes de clave e barras de compasso.
Rythm stage
Neste campo, deve ser dada uma entrada, representando a durao, por cada
nota, acorde de notas e pausas entradas no campo anterior.
Marks stage
Este campo utilizado para dar entradas sobre a articulao, dinmica, entre
outros smbolos.
Beams stage
Slurs stage
O ltimo campo de entrada serve para dar indicao de todas as ligaduras
existentes.
67