So Solving ¡ ¡geometry ¡ ¡problems: ¡ ¡ co combining ¡ ¡text ¡ ¡and ¡ ¡diagram ¡ ¡ in interpretatio ion
Minjoon ¡ Seo1, ¡Hannaneh Hajishirzi1, ¡Ali ¡Farhadi1,2, ¡ Oren ¡Etzioni2, ¡Clint ¡Malcolm1
- Sep. ¡20
EMNLP ¡2015 1 2
1
So Solving geometry problems: co combining text - - PowerPoint PPT Presentation
So Solving geometry problems: co combining text and diagram in interpretatio ion Minjoon Seo 1 , Hannaneh Hajishirzi 1 , Ali Farhadi 1,2 , Oren Etzioni 2 ,
Minjoon ¡ Seo1, ¡Hannaneh Hajishirzi1, ¡Ali ¡Farhadi1,2, ¡ Oren ¡Etzioni2, ¡Clint ¡Malcolm1
EMNLP ¡2015 1 2
1
In the diagram at the right, circle O has a radius of 5, and CE =
perpendicular to chord
a) 2 b) 4 c) 6 d) 8 e) 10
E B D A O 5 2 C
2
(Kushman et ¡al., ¡2014; ¡Hosseini et ¡al., ¡2014; ¡Roy ¡et ¡al., ¡2015; ¡Dai ¡et ¡al., ¡2015; ¡Shi ¡ et ¡al., ¡2015)
(Kushman et ¡al., ¡2014; ¡Hosseini et ¡al., ¡2014; ¡Roy ¡et ¡al., ¡2015; ¡Dai ¡et ¡al., ¡2015; ¡Shi ¡ et ¡al., ¡2015)
In the diagram at the right, circle O has a radius of 5, and CE =
perpendicular to chord
a) 2 b) 4 c) 6 d) 8 e) 10
(Kushman et ¡al., ¡2014; ¡Hosseini et ¡al., ¡2014; ¡Roy ¡et ¡al., ¡2015; ¡Dai ¡et ¡al., ¡2015; ¡Shi ¡ et ¡al., ¡2015)
5
E B D A O 5 2 C
(Kushman et ¡al., ¡2014; ¡Hosseini et ¡al., ¡2014; ¡Roy ¡et ¡al., ¡2015; ¡Dai ¡et ¡al., ¡2015; ¡Shi ¡ et ¡al., ¡2015)
acquisition
Mooney, ¡2007; ¡Poon ¡and ¡Domingos, ¡2009; ¡Kwiatkowski ¡et ¡al., ¡2013; ¡Flanigan et ¡al., ¡2014; ¡ Reddy ¡et ¡al., ¡2014; ¡Berant et ¡al., ¡2014; Cowie and ¡Lehnert, ¡1996; ¡Culotta and ¡Sorensen, ¡ 2004)
7
In ¡the ¡diagram ¡at ¡the ¡ right, ¡the ¡line is ¡tangent ¡ to ¡the ¡circle. A B O C
8 8
A B O C Line ¡OC ¡bisects line ¡AB, ¡ and ¡line ¡OC ¡bisects angle ¡ AOB.
9
Circle ¡O ¡has ¡a ¡radius ¡of ¡5.
E B D A O 5 2 C
Equals(RadiusOf(O), 5)
10
A B C D
AB ¡and ¡CD ¡are ¡perpendicular. AB ¡and ¡CD ¡are ¡perpendicular ¡to ¡ EF.
A B C D E F
11
B D E A C
In ¡triangle ¡ABC, ¡line ¡ DE ¡is ¡parallel ¡with ¡line ¡ AC, ¡DB ¡equals ¡4, ¡AD ¡is ¡ 8, ¡and ¡DE ¡is ¡5. ¡Find ¡ AC. (a) ¡9 ¡ ¡ ¡(b) ¡10 ¡ ¡(c) ¡12.5 ¡ ¡ ¡ (d) ¡15 ¡ ¡ ¡(e) ¡17
IsTriangle(ABC) ¡∧ Parallel(AC, ¡DE) ∧ Equals(LengthOf(DB), ¡4) ¡∧ Equals(LengthOf(AD), ¡8) ¡∧ Equals(LengthOf(DE), ¡5) ¡∧ Find(LengthOf(AC)) PointLiesOnLine(D, ¡AB) ¡∧ PointLiesOnLine(E, ¡BC)
12
In ¡triangle ¡ABC, ¡line ¡DE ¡is ¡parallel ¡with ¡ line ¡AC, ¡DB ¡equals ¡4, ¡AD ¡is ¡8, ¡and ¡DE ¡is ¡5. ¡ Find ¡AC. (a) ¡9 ¡ ¡ ¡(b) ¡10 ¡ ¡(c) ¡12.5 ¡ ¡ ¡(d) ¡15 ¡ ¡ ¡(e) ¡17
B D E A C
IsTriangle(ABC) ∧ Parallel(AC, ¡DE) ∧ Equals(LengthOf(DB), ¡4) ¡ ¡∧ ¡ Equals(LengthOf(AD), ¡8) ¡∧ Equals(LengthOf(DE), ¡5) ¡∧ ¡ Find(LengthOf(AC))
13
Text Input Logical form
In ¡triangle ¡ABC, ¡line ¡DE ¡is ¡parallel ¡with ¡ line ¡AC, ¡DB ¡equals ¡4, ¡AD ¡is ¡8, ¡and ¡DE ¡is ¡5. ¡ Find ¡AC. (a) ¡9 ¡ ¡ ¡(b) ¡10 ¡ ¡(c) ¡12.5 ¡ ¡ ¡(d) ¡15 ¡ ¡ ¡(e) ¡17
B D E A C
IsTriangle(ABC) Parallel(AC, ¡DE) Parallel(AC, ¡DB) Equals(LengthOf(DB), ¡4) Equals(LengthOf(AD), ¡8) Equals(LengthOf(DE), ¡5) Equals(4, ¡LengthOf(AD)) …
Over-‑generated ¡literals
0.96 0.91 0.74 0.97 0.94 0.94 0.31 …
Text ¡scores
1.00 0.99 0.02 n/a n/a n/a n/a …
Diagram ¡scores Selected ¡subset
14
Text Input Logical form Our ¡ method
IsTriangle(ABC) ∧ Parallel(AC, ¡DE) ∧ Equals(LengthOf(DB), ¡4) ¡ ¡∧ ¡ Equals(LengthOf(AD), ¡8) ¡∧ Equals(LengthOf(DE), ¡5) ¡∧ ¡ Find(LengthOf(AC))
In ¡triangle ¡ABC, ¡line ¡DE ¡is ¡parallel ¡with ¡ line ¡AC, ¡DB ¡equals ¡4, ¡AD ¡is ¡8, ¡and ¡DE ¡is ¡5. ¡ Find ¡AC. (a) ¡9 ¡ ¡ ¡(b) ¡10 ¡ ¡(c) ¡12.5 ¡ ¡ ¡(d) ¡15 ¡ ¡ ¡(e) ¡17
B D E A C
IsTriangle(ABC) Parallel(AC, ¡DE) Parallel(AC, ¡DB) Equals(LengthOf(DB), ¡4) Equals(LengthOf(AD), ¡8) Equals(LengthOf(DE), ¡5) Equals(4, ¡LengthOf(AD)) …
Over-‑generated ¡literals
15
“Lines ¡AB ¡and ¡CD ¡are ¡perpendicular ¡to ¡EF”
IsLine(AB) IsLine(CD) IsLine(EF) Perpendicular(AB, CD) Perpendicular(CD, EF) Perpendicular(AB, EF)
16
“Lines ¡AB ¡and ¡CD ¡are ¡perpendicular ¡to ¡EF”
IsLine(AB) IsLine(CD) IsLine(EF) Perpendicular(AB, CD) Perpendicular(CD, EF) Perpendicular(AB, EF)
Red ¡literals ¡ are ¡false.
17
18
Word ¡or phrase Concept “Perpendicular” Perpendicular “Lies ¡on” PointLiesOnLine, PointLiesOnCircle “CD” line, arc “ABC” triangle, angle
19
20
Unary ¡relation
21
Binary ¡relation
22
In ¡triangle ¡ABC, ¡line ¡DE ¡is ¡parallel ¡with ¡ line ¡AC, ¡DB ¡equals ¡4, ¡AD ¡is ¡8, ¡and ¡DE ¡is ¡5. ¡ Find ¡AC. (a) ¡9 ¡ ¡ ¡(b) ¡10 ¡ ¡(c) ¡12.5 ¡ ¡ ¡(d) ¡15 ¡ ¡ ¡(e) ¡17
B D E A C
IsTriangle(ABC) Parallel(AC, ¡DE) Parallel(AC, ¡DB) Equals(LengthOf(DB), ¡4) Equals(LengthOf(AD), ¡8) Equals(LengthOf(DE), ¡5) Equals(4, ¡LengthOf(AD)) …
Over-‑generated ¡literals
0.96 0.91 0.74 0.97 0.94 0.94 0.31 …
Text ¡scores
23
0.78
24
etc.)
25
IsLine->AB IsLine->CD IsLine->EF Perpendicular->AB, CD Perpendicular->CD, EF Perpendicular->AB, EF
0.94 0.87
1, 𝑢)
1
“Circle ¡O ¡has ¡radius ¡of ¡5”
26
In ¡triangle ¡ABC, ¡line ¡DE ¡is ¡parallel ¡with ¡ line ¡AC, ¡DB ¡equals ¡4, ¡AD ¡is ¡8, ¡and ¡DE ¡is ¡5. ¡ Find ¡AC. (a) ¡9 ¡ ¡ ¡(b) ¡10 ¡ ¡(c) ¡12.5 ¡ ¡ ¡(d) ¡15 ¡ ¡ ¡(e) ¡17
B D E A C
IsTriangle(ABC) Parallel(AC, ¡DE) Parallel(AC, ¡DB) Equals(LengthOf(DB), ¡4) Equals(LengthOf(AD), ¡8) Equals(LengthOf(DE), ¡5) Equals(4, ¡LengthOf(AD)) …
Over-‑generated ¡literals
0.96 0.91 0.74 0.97 0.94 0.94 0.31 …
Text ¡scores
1.00 0.99 0.02 n/a n/a n/a n/a …
Diagram ¡scores
27
B D E A C TEXT DIAGRAM Parallel(AC, DB) 0.74 0.02
28
“AC ¡and ¡DB ¡are ¡parallel ¡with ¡DE ¡and ¡AD, ¡respectively.”
B D E A C
29
TEXT DIAGRAM Parallel(AC, DB) 0.74 0.02 Parallel(AC, DE) 0.78 0.99 “AC ¡and ¡DB ¡are ¡parallel ¡with ¡DE ¡and ¡AD, ¡respectively.”
B D E A C
Diagram ¡understanding ¡in ¡geometry ¡questions ¡(Seo ¡et ¡al., ¡2014)
30
TEXT DIAGRAM Parallel(AC, DB) 0.74 0.02 Parallel(AC, DE) 0.78 0.99 “AC ¡and ¡DB ¡are ¡parallel ¡with ¡DE ¡and ¡AD, ¡respectively.”
In ¡triangle ¡ABC, ¡line ¡DE ¡is ¡parallel ¡with ¡ line ¡AC, ¡DB ¡equals ¡4, ¡AD ¡is ¡8, ¡and ¡DE ¡is ¡5. ¡ Find ¡AC. (a) ¡9 ¡ ¡ ¡(b) ¡10 ¡ ¡(c) ¡12.5 ¡ ¡ ¡(d) ¡15 ¡ ¡ ¡(e) ¡17
B D E A C
IsTriangle(ABC) Parallel(AC, ¡DE) Parallel(AC, ¡DB) Equals(LengthOf(DB), ¡4) Equals(LengthOf(AD), ¡8) Equals(LengthOf(DE), ¡5) Equals(4, ¡LengthOf(AD)) …
Over-‑generated ¡literals
0.96 0.91 0.74 0.97 0.94 0.94 0.31 …
Text ¡scores
1.00 0.99 0.02 n/a n/a n/a n/a …
Diagram ¡scores Selected ¡subset
31
IsTriangle(ABC) ∧ Parallel(AC, ¡DE) ∧ Equals(LengthOf(DB), ¡4) ¡ ¡∧ ¡ Equals(LengthOf(AD), ¡8) ¡∧ Equals(LengthOf(DE), ¡5) ¡∧ ¡ Find(LengthOf(AC))
IsTriangle(ABC) Parallel(AC, ¡DE) Parallel(AC, ¡DB) Equals(LengthOf(DB), ¡4) Equals(LengthOf(AD), ¡8) Equals(LengthOf(DE), ¡5) Equals(4, ¡LengthOf(AD)) Equals(LengthOf(AC), ¡4) Parallel(DE, ¡DB) Equals(LengthOf(DB, ¡8) Find(LengthOf(AC)) Find(LengthOf(DE)) Find(LengthOf(DB)) … IsTriangle(ABC) Parallel(AC, ¡DE) Equals(LengthOf(DB), ¡4) Equals(LengthOf(AD), ¡8) Equals(LengthOf(DE), ¡5) Find(LengthOf(AC))
?@⊂?
Affinity (diagram+text) Coherence (covers ¡all ¡facts, no ¡conflict)
32
?@⊂?
affinity coherence
IJ∈?∖?@ ℱ 𝑀C ∪ 𝑚H
33
34
Literal Equation Equals(LengthOf(AB),d) (Ax-‑Bx)2+(Ay-‑By)2-‑d2 = ¡0 Parallel(AB, ¡CD) (Ax-‑Bx)(Cy-‑Dy)-‑(Ay-‑By)(Cx-‑Dx) ¡= ¡0 PointLiesOnLine(B, ¡AC) (Ax-‑Bx)(By-‑Cy)-‑(Ay-‑By)(Bx-‑Cx) ¡= ¡0 Perpendicular(AB,CD) (Ax-‑Bx)(Cx-‑Dx)+(Ay-‑By)(Cy-‑Dy) ¡ = ¡0
35
geometry.allenai.org
36
10 20 30 40 50 60
GeoS ¡(our ¡ system)
SAT ¡Score ¡(%) *** ¡0.25 ¡penalty ¡for ¡incorrect ¡answer
37
10 20 30 40 50 60
Text ¡only Diagram ¡
GeoS
SAT ¡Score ¡(%) *** ¡0.25 ¡penalty ¡for ¡incorrect ¡answer
38
10 20 30 40 50 60
Text ¡only Diagram ¡
Rule-‑based GeoS
SAT ¡Score ¡(%) *** ¡0.25 ¡penalty ¡for ¡incorrect ¡answer
39
10 20 30 40 50 60
Text ¡only Diagram ¡
Rule-‑based GeoS Student ¡ average
SAT ¡Score ¡(%) *** ¡0.25 ¡penalty ¡for ¡incorrect ¡answer
40
E C B D A
41
10 20 30 40 50 60 70 80 90
Stanford ¡dep ¡parse ¡
With ¡GeoS
42
10 20 30 40 50 60 70 80 90 100
GeoS GeoS Improvement Incorrect
43
10 20 30 40 50 60 70 80 90 100
GeoS Oracle ¡TP+GeoS ¡DP GeoS Improvement Incorrect
44
10 20 30 40 50 60 70 80 90 100
GeoS Oracle ¡TP+GeoS ¡DP GeoS ¡TP+Oracle ¡DP GeoS Improvement Incorrect
45
10 20 30 40 50 60 70 80 90 100
GeoS Oracle ¡TP+GeoS ¡DP GeoS ¡TP+Oracle ¡DP Oracle ¡TP+Oracle ¡DP GeoS Improvement Incorrect
46
In#the#figure#at#the#le-,#the#smaller#circles# each#have#radius#3.#They#are#tangent#to#the# larger#circle#at#points#A#and#C,#and#are#tangent# to#each#other#at#point#B,#which#is#the#center#of# the#larger#circle.#What#is#the#perimeter#of#the# shaded#region?# In#the#figure#at#the#le-,#a#shaded# polygon#which#has#equal#angles#is# parCally#covered#with#a#sheet#of# blank#paper.#If#x+y=80,#how#many# sides#does#the#polygon#have?##
(a)#6*pi###(b)#8*pi###(c)#9*pi###(d)#8*pi###(e)#15*pi# (a)#10###(b)#9####(c)#8####(d)#7###(e)#6#
Fails&to&resolve&“they”&to&“each&other”& Requires&complex&reasoning:&& Cannot&understand&that&the&polygon& is&“hidden”&
47
48
49
50
Easy Hard!
51
(Kwiatkowski ¡et ¡al., ¡2013)
“Circle ¡O ¡has ¡radius ¡of ¡5”
Equals(RadiusOf(O), 5) Bridged(RadiusOf(O), 5)
Natural ¡language “Circle ¡O ¡has ¡a ¡radius ¡of ¡5.” Intermediate Bridged(RadiusOf(O), 5) Formal ¡language Equals(RadiusOf(O), 5) Natural ¡language “AM ¡and ¡CM ¡bisect ¡BAC ¡and ¡BCA.” Intermediate Bisects(AM, BAC) ∧ CC(AM, CM) ∧ CC(BAC, BCA) Formal ¡language Bisects(AM,BAC) ∧ Bisects(CM, BCA)
52
C,𝑢 + O1PQRPS 𝑚H C,𝑒 IJ
@∈?@
53
“DE ¡is ¡parallel ¡with ¡AB, ¡and ¡EF ¡equals ¡5.” Parallel(DE, EF) Equals(AB, 5) Equals(EF, 5) Parallel(DE, AB) Parallel(DE, EF) Equals(AB, 5) Parallel(DE, AB) Equals(EF, 5) High ¡coverage, ¡high ¡redundancy Low ¡coverage, ¡low ¡redundancy High ¡coverage, ¡low ¡redundancy High ¡coverage, ¡low ¡redundancy
coverage redundancy
54
AB ¡is ¡perpendicular ¡to ¡BC, ¡AB ¡= ¡3 ¡and ¡BC ¡= ¡4. What ¡is ¡the ¡length ¡of ¡AB? a) ¡3 ¡ ¡ ¡b) ¡4 ¡ ¡ ¡c) ¡5 ¡ ¡ ¡d) ¡6 ¡ ¡ ¡e) ¡7 Perpendicular(AB, BC) Equals(LengthOf(AB), 3) Equals(LengthOf(BC, 4) Equals(LengthOf(AC), What) A B C
55
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
F1 ¡Score
56