Optimización de consultas SQL

Cada día se necesita procesar mayor cantidad de datos y obtener de manera más rápida y precisa la información.
Muchos de los problemas de rendimiento se deben entre otras cosas al hardware, al software, al motor de base de datos y por sobre todo al diseño, índices y mala formulación de consultas SQL. En este apartado nos centraremos en estos últimos en donde siguiendo algunas recomendaciones veremos que se puede mejorar el tiempo de respuesta de nuestro motor de BD significativamente.

A la hora de diseñar la base de datos

· Las tablas normalizadas permiten reducir al mínimo el espacio ocupado por nuestra base y permiten asegurar la consistencia de la información al mismo tiempo que son muy rápidas para la realización de transacciones, pero generan un mayor tiempo de demora a la hora de consultarlas ya que se deben realizar generalmente la unión de varias tablas, por lo que en caso de necesidad de altas velocidades de respuesta con grandes volúmenes de datos un modelo desnormalizado es más que conveniente teniendo en cuenta todas las implicancias del caso.
· Ajustar al máximo el tamaño de los campos ayuda a no desperdiciar espacio.
· Eliminar todo campo que no sea de utilidad ya que por más que no contenga datos genera retrasos.

Que pasa con los índices ?

· Los índices son campos que permiten la búsqueda a partir de dicho campo a una velocidad notablemente superior. Sin embargo cuentan con la desventaja que hacen más lenta la actualización, carga y eliminación de los registros ya que por cada modificación en la tabla se deberá modificar también el índice, además se debe tener en cuenta el hecho de que los índices también ocupan espacio en disco. Es por esto que no es factible indexar todos los campos de la base y se hace necesario seleccionarlos cuidadosamente. Cabe destacar que por defecto las tablas no contienen índices por lo que la introducción de estos puede llegar a producir mejoras de más del 100% en algunos casos.

Los campos que se recomiendan indexar son:
o Claves Primarias
o Claves Foráneas
o Campos por los cuales se realizaran búsquedas
o Campos por los cuales se va a ordenar

Siempre conviene indexar tablas con gran cantidad de registros y que van a ser consultadas intensamente.

Donde escribir las sentencias ?

· Siempre es preferible utilizar consultas almacenadas dentro del motor de base de datos y no dentro de la aplicación, una consulta almacenada en un procedimiento almacenado por ejem , se ejecuta mucho mas rápido y directamente sobre el motor que cualquier consulta externa. Esto es porque los motores de base de datos tienen que compilar previamente las consultas antes de ejecutarlas, si la consulta se encuentra dentro del motor la misma es guardada ya compilada para acelerar la ejeción. hay que tener en cuenta que tener las consultas dentro del motor trae la desventaja de ligar nuestra aplición al motor de base de datos utilizado, esto hace que no podamos migrar de una base a la otra facilmente ya que al migrar también deberemos migrar las consultas.

· Muchas de las aplicaciones sobre todo de reporting permiten unir y realizar los joins y consultas directamente en la herramienta produciendo una baja de performance realmente considerable. Lo correcto y más eficiente seria generar la consulta en un sp con todos los joins y guardar el resultado en una tabla temporal, de donde posteriormente el reporte solo deberá mostrar los datos sin necesidad de trabajarlos primero. Dependiendo los joins que intervengan y los registros involucrados se pude mejorar drásticamente la performance , han habido casos en que reportes que duraban 3 min en generarse pasaron a 30 seg., usando esta técnica.

Acerca de la formulación de la consultas:

A la hora de ejecutar una consulta SQL la forma en que esta es expresada afecta directamente al motor de BD, pequeños cambios pueden significar la ganancia de muchos segundos o minutos que el usuario debe esperar al momento de ejecutar la consulta. Algunas recomendaciones son:
· No utilizar SELECT * por que el motor debe leer primero la estructura de la tabla antes de ejecutar la sentencia.
· Seleccionar solo aquellos campos que se necesiten, cada campo extra genera tiempo extra.
· Utilizar Inner Join , left join , right join, para unir las tablas en lugar del where, esto permite que a medida que se declaran las tablas se vallan uniendo mientras que si utilizamos el where el motor genera primero el producto cartesiano de todos los registros de las tablas para luego filtrar las correctas, un trabajo definitivamente lento.
· Especificar el alias de la tabla delante de cada campo definido en el select, esto le ahorra tiempo al motor de tener que buscar a que tabla pertenece el campo especificado.
· Evitar el uso de Cast. Y formulas dentro de las consultas, cada formula y casteo retrasan el motor considerablemente.

El orden de ubicación las tablas en el from deberían ir en lo preferible de menor a mayor según el número de registros , de esta manera reducimos la cantidad de revisiones de registros que realiza el motor al unir las tablas a medida que se agregan.

This entry was posted in SQL. Bookmark the permalink.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>