terceiro
topo

Palestras de Pesquisa

How high performance computing can drive agriculture and health realted research

by Goran Nesic
The Structural Bioinformatics Laboratory of the EMBRAPA Information Technology is hosting the largest database of the protein structure descriptors in the worldwide scale. Those descriptors are calculated for all known structures (today there are approximately 33 thousand structures available). All descriptors are calculated and then presented in a residue-by-residue fashion (residues are constitutive components of any proteins). Currently the STING database contains 306 attributes/descriptors resulting in more than 9 billions records available for all residues of all known structures. The database updates (weekly and monthly) represent a tremendous challenge in terms of optimization of the code and requirement for the CPU power. Those structures related attributes are very important for understanding the relationship between the sequence of the proteins, their structure and function. Once we understand the function, we may proceed to its modification and there we get into the area of applications such as how to eliminate (or enhance) the function of the protein belonging to say bacterium or virus invading the host organism and by invasion generating a negative reaction of such host. Those are the key issues behind the most intensive health (disease) related and agriculture related (herbicides, pesticides etc) research activities today.

Goran Nesic is the Structural BioInformatics (SBI) group leader at the Brazilian Agricultural Research Corporation (EMBRAPA), National Agricultural Information Technology Research Center (CNPTIA), Campinas - SP, Brazil. Nesic started his work in structural bioinformatics while studying structure and function relationship of the photosynthetic reaction center during his graduate work done with Don DeVault at the University of Illinois at Urbana-Champaign. He conducted his postdoctoral research with Barry Honig at Columbia University. Nesic is the principal author of STING, STING Millennium Suite, Gold STING and Diamond STING (current version). STING is a popular software application, database and visualization tool providing one of the largest collections of the physicochemical parameters describing proteins' structure, stability, function and interaction with other macromolecules.

Programação Dinâmica Estocástica Aplicada a Subsistemas Equivalentes

by Isabel Rosseti
O Brasil possui um sistema interligado de geração elétrica que predominantemente utiliza seus recursos hídricos. Atualmente, 92 % da geração elétrica provêm de aproveitamentos hídricos. O problema do planejamento e da programação da operação de geração de energia elétrica de sistemas hidrotérmicos interligados é um problema de grande porte e que tem por objetivo a obtenção de estratégias que minimizem o custo total de operação sem que seja comprometido o nível de garantia de atendimento.
O custo total que se pretende minimizar compreende a soma dos custos variáveis de todos os recursos utilizados, sejam estes provenientes de geração térmica, ou caso a demanda não seja suprida, do custo associado à falta de energia elétrica. Ele é composto por duas parcelas, a saber: o custo imediato, referente às decisões que estão sendo tomadas, e o custo futuro, que pela predominância da hidroeletricidade no sistema brasileiro, é influenciado pelas decisões tomadas no presente. O custo imediato é trivial de ser determinado porque corresponde às despesas decorrentes das decisões presentes. Já para se determinar qual é o valor do custo futuro seria necessário conhecer o que ocorrerá nos próximos anos. No sistema brasileiro, no entanto, o custo futuro depende das afluências (ou vazões) que vão ocorrer nos rios em que estão instaladas as usinas hidroelétricas. E estas, assim como a temperatura, têm um alto grau de incerteza.
A programação dinâmica estocástica (PDE) é o método classicamente adotado para a solução do problema de planejamento da operação em que está presente a estocasticidade das afluências. Na PDE, um problema se divide em estágios de tempo e determina-se a decisão de menor custo a cada etapa, de acordo com o estado em que se encontra o sistema. A otimalidade de cada decisão é baseada no conhecimento de todas as possibilidades futuras e suas conseqüências. A principal desvantagem desta técnica, chamada de maldição de dimensionalidade, é que ela aumenta exponencialmente o esforço computacional a cada nova variável de estado (por exemplo, uma nova usina) acrescida ao problema. Isto impede o uso da PDE em problemas em que se precisa construir a estratégia para a operação de múltiplas usinas.
Devido à maldição de dimensionalidade, foram desenvolvidas aproximações para diminuir o número de estados do sistema. Uma delas foi à agregação de bacias hidrográficas semelhantes, e, conseqüentemente, a agregação do parque gerador existentes nestas bacias, em um sistema equivalente de energia. Mesmo assim, sua extensão para mais de um subsistema equivalente foi considerada inviável em meados da década de 80 com os recursos computacionais disponíveis. Esta abordagem foi substituída ao final da década de 90 pela programação dinâmica estocástica dual (PDED), que visa, aproximar, através de um processo iterativo, a função de custo futuro. Porém, da forma que a PDED tem sido usada nos métodos atualmente adotados, a aproximação obtida ainda não é capaz de dotar os resultados da desejável robustez e estabilidade. Decorridas duas décadas em que a velocidade dos processadores tornou-se cerca de mil vezes maior, torna-se oportuno investigar a possibilidade do uso da PDE, em conjunto com o processamento paralelo, para tratar o problema de planejamento da operação, considerando subsistemas equivalentes interligados.

EELA - E-Infraestructure Shared Between Europe and Latin America

by Diego Carvalho
Diego Carvalho is the Project Manager in the Central Computing Facility of the Physics Institute of Federal University of Rio de Janeiro (IF/UFRJ), where he coordinates the Network and Grid innovation programme, amongst other activities. He graduated in Production Engineering (Escola Politécnica/UFRJ) and holds a Master’s Degree in Systems Engineering and Computer Science (COPPE/UFRJ). He worked at the DELPHI Experiment (CERN) as a Computer scientist expert in Complex Distributed Real Time Data Acquisition & Control Systems and acted as a project manager in several object oriented software development projects sponsored by the National Council for Scientific and Technological Development (CNPq/Brazil). His professional experience covers diverse areas such as object oriented design, distributed systems, network engineering, parallel architectures and grid technologies. He is a member of IEEE since 2000 and of the EELA Editorial Board since 2004.

Como e porque processar um genoma

by Ana Tereza Ribeiro de Vasconcelos
Partindo do principio que "a bioinformática é uma nova disciplina científica com raízes nas ciências da computação, na estatística e na biologia molecular" será apresentado um panorama do desenvolvimento da área que esta interligada com os avanços da informática, que é uma das ferramentas necessárias para se trabalhar com a grande quantidade de informações.
A bioinformática desenvolveu-se para enfrentar os resultados das iniciativas de seqüenciamento de genes, que produzem uma quantidade cada vez maior de dados sobre proteínas, DNA e RNA. Desse modo, os biólogos moleculares passaram a utilizar métodos estatísticos capazes de analisar grandes quantidades de dados biológicos, a predizer funções dos genes e a demonstrar relações entre genes e proteínas. Alguns exemplos serão apresentados.

Ana Tereza Ribeiro de Vasconcelos é Doutora em Genetica pela UFRJ. Contratada pelo LNCC em 1983 e atuando na área de Bioinformatica desde 1990. Em 2000 fundou o laboratório de Bioinformatica - LABINFO. Coordenadora do Projeto Genoma Brasileiro e Presidente da Associaçao de Bionformatica e Biologia Computacional.