Equivalenza di Espressioni Algebriche

(1)

& %

Equivalenza di Espressioni Algebriche

Angelo Montanari

Dipartimento di Matematica e Informatica Universit`a di Udine

(2)

& %

Introduzione

L’equivalenza di espressioni dell’algebra relazionale viene sfruttata nella fase di ottimizzazione algebrica delle interrogazioni:

• le interrogazioni formulate nel linguaggio SQL vengono

tradotte in espressioni (equivalenti) dell’algebra relazionale

• il costo dell’esecuzione di un’interrogazione viene valutato in termini delle dimensioni dei risultati intermedi (della

valutazione dell’espressione dell’algebra relazionale);

in presenza di varie espressioni alternative equivalenti, viene scelta quella con costo minore

Vengono utilizzate delle trasformazioni di equivalenza:

operazioni che sostituiscono un’espressione con un’altra a essa equivalente

(3)

& %

Equivalenze assolute e dipendenti dallo schema

Diversi tipi di equivalenza:

(1) Equivalenza dipendente dallo schema.

E₁ ≡R E² se E₁(r) = E₂(r) per ogni r ∈ R

(2) Equivalenza assoluta (non dipendente dallo schema).

E₁ ≡ E₂ se E₁ ≡R E² per ogni schema R Un esempio di equivalenza assoluta:

Π_AB(σ_A>0(R₁)) ≡ σ_A>0(Π_AB(R₁)) Un esempio di equivalenza dipendente dallo schema:

Π_AB(R₁) ./ Π_AC(R₂) ≡R Π^ABC(R₁ ./R₂)

che vale se e solo se in R l’intersezione tra gli insiemi di attributi di R₁ e di R₂ `e pari ad A.

(4)

& %

Un primo insieme di trasformazioni - 1

Atomizzazione delle selezioni: una congiunzione di selezioni pu`o essere sostituita da una sequenza di selezioni atomiche

σ_F₁_∧F₂(E) ≡ σ_F₂(σ_F₁(E)) con E espressione qualsiasi.

Idempotenza delle proiezioni: una proiezione pu`o essere trasformata in una sequenza di proiezioni che eliminano i vari attributi in varie fasi

π_X(E) ≡ π_X(π_XY (E))

con E espressione definita su un insieme di attributi che contiene X e Y .

(5)

& %

Un primo insieme di trasformazioni - 2

Anticipazione della selezione rispetto al join (pushing selections down):

σ_F(E₁ ./ E₂) ≡ E₁ ./ σ_F(E₂)

se la condizione F coinvolge solo attributi della sottoespressione E₂. Anticipazione della proiezione rispetto al join (pushing

projections down):

π_X₁_Y₂(E₁ ./ E₂) ≡ E₁ ./ π_Y₂(E₂) con E₁ definita su X₁, E₂ definita su X₂, Y₂ ⊆ X₂ e

(X₁ ∩ X₂) ⊆ Y₂ (gli attributi di X₂ \ Y₂ non sono coinvolti nel join).

(6)

& %

Una trasformazione derivata

Combinando la regola di anticipazione della proiezione rispetto al join con la regola di idempotenza delle proiezioni, si ottiene la seguente regola derivata (che elimina da subito gli attributi che non sono coinvolti nel join e non compaiono nel risultato finale):

π_Y (E₁ ./_F E₂) ≡ π_Y (π_Y₁(E₁) ./_F π_Y₂(E₂))

dove, assumendo che E₁ sia definita su X₁, E₂ sia definita su X₂ e J₁ (rispettivamente J₂) sia il sottoinsieme di X₁ (rispettivamente X₂) coinvolto nell’operazione di join, si ha che:

Y₁ = (X₁ ∩ Y ) ∪ J₁ Y₂ = (X₂ ∩ Y ) ∪ J₂

(7)

& %

Un esempio - 1

Interrogazione: trovare i nomi dei dipartimenti il cui manager guadagna pi`u di 80000 euro.

Soluzione non ottimizzata:

π_{DN OM E}(σCF =M AN AGER∧ST IP EN DIO>80000

(IM P IEGAT O ./ DIP ART IM EN T O)) che si pu`o riscrivere come:

π_{DN OM E}(σCF =M AN AGER(σST IP EN DIO>80000

(IM P IEGAT O ./ DIP ART IM EN T O)))

(8)

& %

Un esempio - 2

La precedente espressione pu`o a sua volta essere riscritta nel modo seguente:

π_{DN OM E}(σST IP EN DIO>80000(IM P IEGAT O) ./CF =M AN AGER DIP ART IM EN T O)

che pu`o a sua volta essere riscritta come:

π_{DN OM E}(π_CF(σST IP EN DIO>80000(IM P IEGAT O)) ./CF =M AN AGER DIP ART IM EN T O)

P.S. La regola derivata descritta in precedenza potrebbe essere utilizzata per ridurre da subito le dimensioni delle due relazioni..

(9)

& %

Un secondo insieme di trasformazioni - 1

Distributivit`a della selezione rispetto all’unione:

σ_F(E₁ ∪ E₂) ≡ σ_F(E₁) ∪ σ_F(E₂)

Distributivit`a della selezione rispetto alla differenza:

σ_F(E₁ \ E₂) ≡ σ_F(E₁) \ σ_F(E₂)

Distributivit`a della proiezione rispetto all’unione:

π_X(E₁ ∪ E₂) ≡ π_X(E₁) ∪ π_X(E₂)

Non vale la distributivit`a della proiezione rispetto alla differenza.

Ad esempio, date R₁(A, B) e R₂(A, B)

π_A(R₁ \ R₂) 6≡ π_A(R₁) \ π_A(R₂)

non vale se R₁ e R₂ contengono tuple uguali su A e diverse su B

(10)

& %

Un secondo insieme di trasformazioni - 2

Trasformazioni basate sulla corrispondenza tra operatori insiemistici e selezioni complesse:

σ_F₁_∨F₂(R) ≡ σ_F₁(R) ∪ σ_F₂(R)

σ_F₁_∧F₂(R) ≡ σ_F₁(R) ∩ σ_F₂(R) ≡ σ_F₁(R) ./ σ_F₂(R) σ_F₁_∧¬(F₂₎(R) ≡ σ_F₁(R) \ σ_F₂(R)

Propriet`a distributiva del join rispetto all’unione:

E₁ ./ (E₂ ∪ E₃) ≡ (E₁ ./ E₂) ∪ (E₁ ./ E₃)

N.B. Risultati intermedi vuoti (relazioni prive di tuple) permettono di semplificare le espressioni (join/prodotto cartesiano con la

relazione vuota come uno degli operandi producono quale risultato la relazione vuota).