magic.py

import os
import sys
import readline

# 读取文件
def readLine(fileName,handleLine,r=[],isShowLine=False):
	with open(fileName,'r') as fb:
		n = 0
		for line in fb.readlines():
			n+=1
			hr = handleLine(n,line,isShowLine)
			if hr :
				if type(hr)==list:
					r += hr
				else:
					r.append(hr)
	return r
import re

# 词法分析规则
re_Pat = re.compile(r'\s*((//.*)|([0-9]+)|("(?:\\"|\\\\|\\n|[^"])*")|([a-z_A-Z][a-z_A-Z0-9]*)|(==|\*\*|>=|<=|&&|\|\||[^A-Za-z0-9_]))?')

# 词法分析
def lexicalAnalysis(no,line,isShowLine=False):
	if isShowLine:
		print(no,line)
	rl = []
	b = 0
	end = len(line)
	while b<end:
		rre = re_Pat.match(line[b:end])
		b += rre.end()
		t = 'commit' if rre.group(2) else 'num' if rre.group(3) else 'str' if rre.group(4) else 'id' if rre.group(6) else 'id'
		if rre.group(1):
			rl.append((no,t,rre.group(1)))
	rl.append((no,'EOL','\n'))
	if isShowLine:
		for rrr in rl:
			print(rrr)
	return rl

# 词法读取
class LexerReader(object):
	def __init__(self,lexer):
		self.lexer = lexer
		self.cur = 0
		self.pre = 0
		self.lineBegin=0
		self.nowLine=0
		self.len = len(lexer)
	def read(self):
		if self.cur >= self.len:
			return False
		k = self.lexer[self.cur]
		self.cur += 1
		self.pre = 0
		# print('read',k,self.cur,self.pre)
		return k
	def seed(self,step=0):
		if self.cur+step+self.pre >= self.len:
			return False
		k = self.lexer[self.cur+step+self.pre]
		# print('seed',k,self.cur,self.pre,step)
		return k
	def line(self):
		return self.seed()[0]
	def lpos(self):
		if self.nowLine!=self.line():
			self.lineBegin=self.cur+self.pre -self.lineBegin
			self.nowLine=self.line()
		return self.cur+self.pre -self.lineBegin
	def pos(self):
		return self.cur,self.pre
	def isEnd(self):
		return self.seed()[1]=='EOF' if self.seed() else True
	def nextSeed(self):
		self.pre += 1
	def r(self,p=False):
			return self.seed() if p else self.read()
	def seedClear(self):
		self.pre = 0

# 非裁剪语法树分支名集合(全局)
noCutTreeTypes = []
# 是否显示分析树的合并日志
showAddTreeLog = False
showAskTreeLog = False
def log(*arg):
	if showAskTreeLog:
		print(*arg)
# 语法分析工具
class P(object):
	def __init__(self,tag=None):
		self.tag = tag
		self.args = []
	def parse(self,reader,rps):
		ps = []
		if self.tag:
			ps.append(self.tag)
		i = 0
		for p in self.args:
			log('next Parse ...',i,len(self.args),p,self.tag,p.tag)
			p.parse(reader,ps)
			i += 1
		self.addTree(rps,ps,reader)
	def ask(self,reader):
		p = self.args[0]
		if p :
			return p.ask(reader)
	def setTag(self,tag):
		self.tag = tag
		return self
	def which(self,parser):
		return WhichParser().add(self).add(parser) if type(self)!=WhichParser else self.add(parser)
	def add(self,other):
		self.args.append(other)
		# if other and not other.tag:
		# 	other.tag = str(self.tag) + '_' + str(len(self.args))
		return self
	def __or__(self,parser):
		return self.which(parser)
	def __add__(self,other):
		return self.add(other)
	def loop(self,onlyOne=False):
		return LoopParser(self,onlyOne)
	def clear(self):
		self.args.clear()
	def noCut(self):
		if self.tag and not self.tag in noCutTreeTypes:
			noCutTreeTypes.append(self.tag)
		return self
	def addTree(self,tree,subTree,reader):
		s = reader.seed()
		if (self.tag or (subTree and len(subTree)>1 and type(subTree[0])==str)) and tree:
			if showAddTreeLog:
				print('<',reader.pos()[0],s,self.tag,type(self),tree,'||',subTree)
			if subTree[0] in noCutTreeTypes:
				tree.append(subTree)
			else:
				tree.append(subTree if len(subTree)>2 else subTree[1] if len(subTree)==2 else None)
			# tree.append(subTree)
		else:
			if showAddTreeLog:
				print('+',reader.pos()[0],s,self.tag,type(self),tree,'||',subTree,'???')
			tree += subTree
class WhichParser(P):
	def __init__(self):
		self.args = []
		self.tag = None
	def parse(self,reader,rps):
		ps = []
		if self.tag:
			ps.append(self.tag)
		p = self.ask(reader)
		log('which Parse ...',p,self.tag,p.tag if p else None)
		if p:
			p.parse(reader,ps)
		else:
			log('pos:',reader.pos())
			log('nextChar:',reader.seed())
			raise ValueError('Parser for %s error ! in line: %d' % (self.tag, reader.line() ))
		self.addTree(rps,ps,reader)
	def ask(self,reader):
		for p in self.args :
			if p.ask(reader):
				return p
class LoopParser(P):
	def __init__(self,parser,onlyOne=False):
		self.parser = parser
		self.onlyOne = onlyOne
		self.tag = None
	def parse(self,reader,rps):
		ps = []
		if self.tag:
			ps.append(self.tag)
		hasNext = self.parser.ask(reader)
		log('will loop Parse ...',hasNext,'||',self.parser,self.tag,self.parser.tag)
		while hasNext:
			log('has loop Parse ...',hasNext,'||',self.parser,self.tag,self.parser.tag)
			self.parser.parse(reader,ps)
			if self.onlyOne:
				break
			hasNext = self.parser.ask(reader)
		self.addTree(rps,ps,reader)
	def ask(self,reader):
		# while (self.parser.ask(reader)):
		# 	self.parser.nextSeed()
		return True
class LeafParser(P):
	def __init__(self,name,token=None,reserved = []):
		self.name = name
		self.token = token
		self.reserved = reserved
		self.tag = name+'_'+str(token)
	def parse(self,reader,ps):
		s = reader.read()
		log(self.name,s,self.token,self.reserved)
		if self.name!='token' and self.name!='commit' and self.name!='EOL' and self.name!='EOF'  :
			# log((self.name,s))
			ps.append((self.name,s[2]))
	def ask(self,reader):
		s = reader.seed()
		log('->ask leaf',s,self.name,self.token,self.reserved)
		if s:
			if (s and len(s)>2 and s[2] in self.reserved) and self.name == 'id':
				return False
			r = self.token==s[2] if self.token else s[1]==self.name
			log('ask leaf',r,self.name,s,self.token,self.reserved)
			return r
def token(token):
	return P()+LeafParser('token',token)
def id(token=None,reserved=[]):
	return P()+LeafParser('id',token,reserved)
def words():
	return P()+LeafParser('str')
def num():
	return P()+LeafParser('num')
def EOL():
	return P()+LeafParser('EOL')
def commit():
	return P()+LeafParser('commit')
class OP(P):
	def __init__(self,parser,optRules={}):
		self.name = 'opt'
		self.parser = parser
		self.optList = optRules
		self.tag = 'opt'
	def parse(self,reader,ps):
		# print('in .. ',self.ask(reader))
		# print('pos',reader.cur)
		optInfo = self.ask(reader)
		while (optInfo) :
			# print('next .. ',ps)
			self.doSwift(reader,ps,optInfo[0]) # 平级平移
			optInfo = self.ask(reader)
		# print('out .. ',ps)
		# print('pos',reader.cur)
	def askNextOpt(self,curInfo,nextInfo):
		if curInfo[1]: # 此算法是否是从左运算的
			return curInfo[0] < nextInfo[0]
		else:
			return curInfo[0] <= nextInfo[0]
	def doSwift(self,reader,ps,level):
		optInfo = self.ask(reader)
		s = reader.read()
		rps = []
		rps.append('opt')
		rps.append(s)
		self.parser.parse(reader,rps)
		nsInfo = self.ask(reader)
		# print('doSwift in :',s,optInfo,reader.seed(),nsInfo,(nsInfo and self.askNextOpt(optInfo,nsInfo)))
		# print('pos',reader.cur)
		# print('doSwift in info :', optInfo, nsInfo)
		while (nsInfo and self.askNextOpt(optInfo,nsInfo)): # 进入下级（下一个优先级高）
			# print('doSwift next :', optInfo, nsInfo)
			self.doSwift(reader,rps,nsInfo[0])
			nsInfo = self.ask(reader)
		ps.append(rps)
	def ask(self,reader):
		s = reader.seed()
		if s and len(s)>2 and s[2] in self.optList:
			return self.optList[s[2]]
		return False

# 语法分析规则1(自顶向下)
# primary    : "(" exp ")" | NUMBER 
# involution        : primary {"**" primary}
# mul        : involution {("*"|"/") involution}
# exp        : mul {("+"|"-") mul}
class ParserRules(object):
	def __init__(self,reader):
		self.reader = reader
		self.exp = P('exp')
		self.primary = P('primary') + (token('(') + self.exp + token(')')) | num()
		self.involution = P('involution') + self.primary + ( id('**') + self.primary ).loop()
		self.mul = P('mul') + self.involution + ( (id('*')|id('/')) + self.involution ).loop()
		self.exp = self.exp + self.mul + ((id('+') | id('-')) + self.mul ).loop()
	def parse(self):
		ps = []
		self.exp.parse(self.reader,ps)
		return ps

# 语法分析规则2(同1)（算符部分自底向上）
# primary    : "(" exp ")" | NUMBER 
# exp        : primary {OP primary}
class ParserRules2(object):
	def __init__(self,reader):
		self.reader = reader
		optRules = self.initOptRules()
		self.exp = P('exp')
		self.primary = P('primary') + (token('(') + self.exp + token(')')) | num()
		self.exp = self.exp + self.primary + OP(self.primary,optRules)
	def initOptRules(self):
		optRules = {}
		optRules['+'] = (1,True)
		optRules['-'] = (1,True)
		optRules['*'] = (2,True)
		optRules['/'] = (2,True)
		optRules['**'] = (3,False)
		return optRules
	def parse(self):
		ps = []
		self.exp.parse(self.reader,ps)
		return ps

# 语法分析规则3 
# primary    : "(" expr ")" | NUMBER | IDENTIFIER | STRING
# factor     : "-" primary | primary
# expr       : factor { OP factor }
# block      : "{" [ statement ] {(";" | EOL) [ statement ]} "}"
# simple     : expr
# statement  : "if" expr block [ "else" block ]
#            | "while" expr block
#            | simple
# program    : [ statement ] (";" | EOL)
class ParserRules3(object):
	def __init__(self,reader):
		self.reader = reader
		optRules = self.initOptRules()
		reserved = self.initReserved()

		self.exp = P('exp')
		self.primary = P('primary') + ((token('(') + self.exp + token(')')) | num() | id(None,reserved) | words())
		self.factor = P('factor') + (id('-')+self.primary)|self.primary
		self.exp = self.exp + self.factor + OP(self.factor,optRules)

		self.statement = P('statement')
		self.block = P('block') + token('{') +self.statement.loop(True) + ( P()+ ( token(';')|EOL() )  + self.statement.loop(True)   ).loop()  +token('}')
		self.simple = P('simple') + ( self.exp )
		self.statement = self.statement +(  (  id('if') + self.exp + self.block + ( token('else') + self.block ).loop(True)  ) \
											| (  id('while') + self.exp + self.block  ) \
											| ( self.simple + commit().loop(True) ) \
											| commit() \
										 )
		self.program = P('program') + self.statement.loop(True) + ( token(';')|EOL() )
	def initReserved(self):
		reserved = [ ';' , '}' , '\n' ]
		return reserved
	def initOptRules(self):
		optRules = {}
		optRules['='] = (1,False)
		optRules['=='] = (2,True)
		optRules['>'] = (2,True)
		optRules['<'] = (2,True)
		optRules['+'] = (3,True)
		optRules['-'] = (3,True)
		optRules['*'] = (4,True)
		optRules['/'] = (4,True)
		optRules['%'] = (4,True)
		optRules['**'] = (5,False)
		return optRules
	def parse(self):
		ps = []
		self.err = None
		# try:
		self.program.parse(self.reader,ps)
		# except BaseException as e:
		# 	self.err = e
		# 	ps = []
		return ps

#  打印抽象语法树
def showAST(ast):
	import json
	result = json.dumps(ast,indent=4)
	print(result)
def showAST2(ast,lv=0):
	# print(ast)
	for t in ast:
		if not t:
			continue
		if type(t)!=list:
			print('- - '*lv+' '+str(t))
		else:
			showAST2(t,lv+1)
# 查看语法规则
def showRule(rule,lv=0):
	if lv > 3:
		return
	if type(rule) in { P, WhichParser,}:
		print('- - '*lv+' '+str(rule.tag),'listParser' if type(rule)==P else 'wihchParser')
		for p in rule.args:
			showRule(p,lv+1)
	elif type(rule) == LoopParser:
		print('- - '*lv+' '+str(rule.tag),'LoopParser')
		showRule(rule.parser,lv+1)
	elif type(rule) == OP:
		print('- - '*lv+' '+str(rule.tag),'OP')
	elif type(rule) == LeafParser:
		print('- - '*lv+' '+str(rule.tag),'LeafParser')
	else:
		print('unkown parser ...',rule)


#  运行时环境对象
class Env(object):
	def __init__(self,name='',values={}):
		self.v = values
		self.outer= None
		self.name=name
		self.subId=0
	def setOuter(self,outerEnv):
		self.outer=outerEnv
	def get(self,key,local=False):
		env = self.where(key)
		return self.v[key] if env==self and key in self.v else None if env==self else env.get(key)
	def set(self,key,value,local=False):
		env = self.where(key)
		if env == self:
			self.v[key] = value
		elif env :
			env.set(key,value)
	def where(self,key):
		env = self if key in self.v else self.outer.where(key) if self.outer else None
		return env if env else self
	def sub(name=''):
		self.subId += 1
		vs = {}
		self.set('_%d_%s'%(self.subId,name),vs)
		subEnv = Env(name,vs)
		return subEnv

#  脚本语言解释器
class LangureRunner(object):
	def __init__(self):
		self.evals = {}
		#语句执行
		self.evals['exp'] = self.expEval
		self.evals['simple'] = self.listEval
		self.evals['block'] = self.listEval
		self.evals['statement'] = self.statementEval
		self.evals['program'] = self.listEval
		#计算符操作
		self.evals['opt'] = self.optEval
		self.evals['num'] = lambda ast,env:int(ast[1])
		self.evals['str'] = lambda ast,env:str(ast[1])
		self.evals['id'] = lambda ast,env:env.get(ast[1])
		#测试
		self.evals['demo'] = self.demo
		self.optInit()
	def exec(self,ast,env=Env('runner')):
		r=None
		err=None
		try:
			r = self.run(ast,env)
		except BaseException as e:
			err = e
		return r,err
	def run(self,ast,env):
		# print('ast:',ast)
		# print('env:',env.v)
		if type(ast) not in (list,tuple):
			return None
		k = self.evals[ast[0]]
		return k(ast,env)
	def listEval(self,ast,env):
		index=1
		r=None
		while (index<len(ast)):
			r = self.run(ast[index],env)
			index += 1
		return r
	def statementEval(self,ast,env):
		# print('statementEval',ast)
		if (type(ast) not in (list,tuple)) or len(ast) <=1:
			return None
		if ast[1] and type(ast[1]) in (list,tuple) and len(ast[1]) > 0 and ast[1][0]=='exp':
			for exp in ast[1:]:
				r = self.expEval(exp,env)
		if ast[1] and type(ast[1]) in (list,tuple) and len(ast[1]) > 0:
			if ast[1][0] == 'id' and ast[1][1] == 'while':
				self.whileEval(ast[2],ast[3],env)
			elif ast[1][0] == 'id' and ast[1][1] == 'if':
				self.ifEval(ast[2],ast[3],(ast[4] if len(ast) == 5 else None),env)
	def whileEval(self,ifExp,blocks,env):
		ifR = self.expEval(ifExp,env)
		while ifR :
			self.run(blocks,env)
			ifR = self.expEval(ifExp,env)
	def ifEval(self,ifExp,blocks,blocks2,env):
		ifR = self.expEval(ifExp,env)
		if ifR :
			self.run(blocks,env)
		elif blocks2:
			self.run(blocks2,env)
	def expEval(self,ast,env):
		# print('expEval env:',env.v)
		if len(ast) < 2:
			print('broken program ... exp broken ...',ast)
			return
		left = ast[1]
		optNum = 1
		while len(ast)>=optNum+2 :
			left = self.optEval(ast[optNum+1],left,env)
			optNum+=1
		return left
	def optInit(self):
		self.optSwitch = {
			"==":lambda x,y,env:x==y,
			">":lambda x,y,env:x>y,
			"<":lambda x,y,env:x<y,
			"+":lambda x,y,env:x+y,
			"-":lambda x,y,env:x-y,
			"*":lambda x,y,env:x*y,
			"/":lambda x,y,env:x/y,
			"%":lambda x,y,env:x%y,
			"**":lambda x,y,env:x**y,
			"=":lambda x,y,env:env.set(x,y),
		}
	def optEval(self,ast,left,env):
		# print('optEval',ast,left,env.v)
		if (not left) and left != 0 :
			# print('left is None')
			return
		opt = ast[1][2]
		if type(left)!=float and type(left)!=str and type(left)!=int and len(left) > 1:
			left = left[1] if opt=='=' else self.run(left,env)
		# right = ast[2]
		# print('get right',ast[2])
		right = self.run(ast[2],env)
		# print('right end',right)
		# print('pre right',right,ast[0],ast[1],len(ast))
		nextPos = 1
		while len(ast) >= 3+nextPos:
			right = self.optEval(ast[2+nextPos],right,env)
			nextPos += 1
			# print('next right',right)
		# print(opt,left,right)
		r = self.optSwitch[opt](left,right,env)
		# print('r',r)
		return r
	def demo(self,h):
		print(h)

###############################################测试区#################################################

# 测试解释器
def testRunner():
	l = LangureRunner()
	dst = ['demo','hello,word']
	l.run(dst)

# 词法分析测试
def lexicaltest():
	# ts = ['"awef"','"ddsfe\"','ewfij','"eaf\\""','"ewafe\\awfeijie"','}}}}}}*&^%','32231',r'//afeieajojoiaefw']
	# reg = r'(\W)*'#r'"(\\"|\\\\|\\n|[^"])*"'
	# for t in ts:
	# 	print(t,re.match(reg,t).groups())
	# f = 'taskcenter.lua'
	f = 'store.st'
	r = []
	readLine(f,lexicalAnalysis,r)
	r.append((-1,'EOF',''))
	print(r)
	# reader = LexerReader(r)
	# print(reader.read())

# 语法分析测试（单句脚本）
def testParser():
	# t = '3+5*(4+3)*2/3' # 26.333333333333332
	# t = '123+234*(234-23423)*7/2' # -18991668.0
	# t = 'a = 2*2**3**2+1' # 1025.0
	# t = 'if (4>3) { b = 3-2-1 } else{c=3}'
	# t = 'while (i<50) {i = i+1;b=i+100}'
	# t = 'while(i<50){i=i+1}'
	# t = 'sum = sum + i'
	# t = '(111)'
	# t = '1+1'
	# t = 'h = hh * 3+hh'
	t = '1+3**2*5' # 46
	# t = '5*3**2+1' # 46
	
	lr = lexicalAnalysis(1,t)
	print(lr)
	r = LexerReader(lr)
	g = ParserRules3(r)
	gr = g.parse()
	showAST2(gr)

	# showRule(g.block)

	env = Env('global')
	# env.set('i',3)
	# env.set('sum',0)
	# env.set('b',10)
	env.set('hh',22)
	r = LangureRunner().run(gr,env)
	print('>>>',r)
	print('>>>env:',env.v)

# 运行脚本测试
def runScript(f = 'store.ss'):
	# f = 'taskcenter.lua'
	r = []
	readLine(f,lexicalAnalysis,r)
	r.append((-1,'EOF',''))
	# print('LEX:',r)
	reader = LexerReader(r)
	gr = True
	env = Env('global')
	while ((not reader.isEnd()) and gr):
		# print('line: %d' % reader.line())
		# print('pos: %d' % reader.pos())
		gr = ParserRules3(reader).parse()
		showAST2(gr)
		r = LangureRunner().run(gr,env)
		# if r:
		# 	print('>>>',r)
	if r:
		print('>>>',r)
	print('>>>env:',env.v)

# 运行交互式环境
def runCmd():
	codes = []
	env = Env('global')
	gr = None
	code = ''
	print('SkayScript 0.1 ')
	while True:
		while not gr:
			codes.append(input('>>>' if len(codes)==0 else '...')) 
			if len(codes)>2 and codes[len(codes)-1] == codes[len(codes)-2] == '':
				print('Traceback (most recent call last):')
				print(g.err)
				codes=[]
				continue
			code = ';'.join(codes)
			if code == 'exit' or code == 'exit()':
				return
			lr = lexicalAnalysis(1,code)
			reader = LexerReader(lr)
			g = ParserRules3(reader)
			gr = g.parse()
		# print('code:',code)
		# showAST2(gr)
		r,err = LangureRunner().exec(gr,env)
		if r!=None :
			print(r)
		elif err :
			print('Traceback (most recent call last):')
			print(err)
		# print('>>>env:',env.v)
		gr = None
		codes = []


if __name__=='__main__':
	# testParser()
	# runScript()
	if len(sys.argv)>1 :
		runScript(*sys.argv[2:])
	else:
		runCmd()