Update progress

2022-01-08 17:30:39 +05:30 · 2022-01-08 17:30:39 +05:30 · 07580c6502
commit 07580c6502
parent 0ef022dbd4
2 changed files with 84 additions and 15 deletions
--- a/input_classifier.py
+++ b/input_classifier.py
@ -1,6 +1,7 @@
 import pdb
 import re
 import arrow
 import pybtc
 """ 
 Find make lists of #, *, @ words 
@ -39,7 +40,8 @@ for word in allList:
 """ 
-'''def className(rawstring):
+'''
 def className(rawstring):
    # Create a list that contains @ , # , * and : ; in actual order of occurence with their words. Only : is allowed to exist without a word in front of it. 
    # Check for 1 @ only followed by :, and the class is trigger
    # Check for 1 # only, then the class is tokensystem
@ -472,6 +474,7 @@ def sort_specialcharacter_wordlist(inputlist):
 def firstclassification_rawstring(rawstring):
    #pdb.set_trace()
    specialcharacter_wordlist = extract_specialcharacter_words(rawstring,['@','*','$','#',':'])
    first_classification = find_first_classification(specialcharacter_wordlist, search_patterns)
    return first_classification
@ -493,6 +496,7 @@ def extractAmount_rule(text):
    counter = 0
    value = None
    for idx, word in enumerate(textList):
        print(word)
        try:
            result = float(word)
            if textList[idx + 1] in base_units:
@ -502,15 +506,18 @@ def extractAmount_rule(text):
                value = result
                counter = counter + 1
        except:
            #if word=='5000':
            #    pdb.set_trace()
            for unit in base_units:
                result = word.split(unit)
                print(result)
                if len(result) == 2 and result[1] == '' and result[0] != '':
                    try:
                        value = float(result[0]) * base_units[unit]
                        counter = counter + 1
                    except:
                        continue
-
+    #pdb.set_trace()
    if counter == 1:
        return value
    else:
@ -521,8 +528,30 @@ def findWholeWord(w):
    return re.compile(r'\b({0})\b'.format(w), flags=re.IGNORECASE).search
 def check_flo_address(floaddress):
    if pybtc.is_address_valid(floaddress):
        return floaddress
    else:
        return False
 # Regex pattern for Smart Contract and Token name ^[A-Za-z][A-Za-z0-9_-]*[A-Za-z0-9]$
 def check_regex(pattern, test_string):
    matched = re.match(pattern, test_string)
    is_match = bool(matched)
    return is_match
 def check_existence_of_keyword(inputlist, keywordlist):
    for word in keywordlist:
       if not word in inputlist:
           return False
    return True
 category1 = ['transfer', 'send', 'give']  # keep everything lowercase
 category2 = ['incorporate', 'create', 'start']  # keep everything lowercase
 category3 = ['submit','deposit']
 def truefalse_rule2(rawstring, permitted_list, denied_list):
@ -559,7 +588,7 @@ def selectCategory(rawstring, category1, category2):
        if findWholeWord(word)(rawstring):
            foundCategory2 = word
            break
-    
+        
    if ((foundCategory1 is not None) and (foundCategory2 is not None)) or ((foundCategory1 is None) and (foundCategory2 is None)):
        return False
    elif foundCategory1 is not None:
@ -583,6 +612,7 @@ def text_preprocessing(original_text):
    return original_text,processed_text
 text_list = [
    "create 500 million rmt#",
@ -606,51 +636,79 @@ text_list = [
 ]
 text_list1 = [
-    "Create Smart Contract with the name India-elections-2019@ of the type one-time-event* using the asset rmt# at the address F7osBpjDDV1mSSnMNrLudEQQ3cwDJ2dPR1$ with contract-conditions: (1) contractAmount=0.001rmt (2) expiryTime= Wed May 22 2019 21:00:00 GMT+0530 (3) payeeAddress='F2sfawpoejgoiwjeogieowijgosBpjJ2dPR1'"
+    "create rmt# 5000"
 ]
-
+def super_main_function(text):
 for text in text_list1:
    original_text, processed_text = text_preprocessing(text)
    first_classification = firstclassification_rawstring(processed_text)
    parsed_data = None
    if first_classification['categorization'] == 'tokensystem-C':
        # Resolving conflict for 'tokensystem-C' 
-        tokenamount = apply_rule1(extractAmount_rule,processed_text)
+        tokenamount = apply_rule1(extractAmount_rule, processed_text)
        operation = apply_rule1(selectCategory, processed_text, category1, category2)
        if operation == 'category1' and tokenamount is not None:
-            parsed_data = outputreturn('token_transfer',f"{processed_text}", f"{first_classification['wordlist'][0][:-1]}", f"{tokenamount}")
+            return outputreturn('token_transfer',f"{processed_text}", f"{first_classification['wordlist'][0][:-1]}", f"{tokenamount}")
        elif operation == 'category2' and tokenamount is not None:
-            parsed_data = outputreturn('token_incorporation',f"{processed_text}", f"{first_classification['wordlist'][0][:-1]}", f"{tokenamount}")
+            return outputreturn('token_incorporation',f"{processed_text}", f"{first_classification['wordlist'][0][:-1]}", f"{tokenamount}")
        else:
-            parsed_data = outputreturn('noise')
+            return outputreturn('noise')
    if first_classification['categorization'] == 'smart-contract-creation-C':
        # Resolving conflict for 'smart-contract-creation-C'
        operation = apply_rule1(selectCategory, processed_text, category2, category1+category3)
        if not operation:
            return outputreturn('noise') 
        contract_type = extract_special_character_word(first_classification['wordlist'],'*')
        if not check_existence_of_keyword(['one-time-event'],[contract_type]):
            return outputreturn('noise') 
        contract_name = extract_special_character_word(first_classification['wordlist'],'@')
        if not check_regex("^[A-Za-z][A-Za-z0-9_-]*[A-Za-z0-9]$", contract_name):
            return outputreturn('noise')
        contract_token = extract_special_character_word(first_classification['wordlist'],'#')
        if not check_regex("^[A-Za-z][A-Za-z0-9_-]*[A-Za-z0-9]$", contract_token):
            return outputreturn('noise') 
        contract_address = extract_special_character_word(first_classification['wordlist'],'$')
        contract_address = find_original_case(contract_address, original_text)
        if not check_flo_address(contract_address):
            return outputreturn('noise') 
        contract_conditions = extract_contract_conditions(processed_text, contract_type, contract_token)
        if not resolve_incategory_conflict(contract_conditions,[['userchoices','payeeAddress']]):
-            parsed_data = outputreturn('noise')
+            return outputreturn('noise') 
        else:
            minimum_subscription_amount = ''
            if 'minimumsubscriptionamount' in contract_conditions.keys():
                minimum_subscription_amount = contract_conditions['minimumsubscriptionamount']
                try:
                    float(minimum_subscription_amount)
                except:
                    return outputreturn('noise')
            maximum_subscription_amount = ''
            if 'maximumsubscriptionamount' in contract_conditions.keys():
                maximum_subscription_amount = contract_conditions['maximumsubscriptionamount']
                try:
                    float(maximum_subscription_amount)
                except:
                    return outputreturn('noise')
            if 'userchoices' in contract_conditions.keys():
-                parsed_data = outputreturn('one-time-event-userchoice-smartcontract-incorporation',f"{contract_token}", f"{contract_name}", f"{contract_address}", f"{original_text}", f"{contract_conditions['contractAmount']}", f"{minimum_subscription_amount}" , f"{maximum_subscription_amount}", f"{contract_conditions['userchoices']}", f"{contract_conditions['expiryTime']}")
+                return outputreturn('one-time-event-userchoice-smartcontract-incorporation',f"{contract_token}", f"{contract_name}", f"{contract_address}", f"{original_text}", f"{contract_conditions['contractAmount']}", f"{minimum_subscription_amount}" , f"{maximum_subscription_amount}", f"{contract_conditions['userchoices']}", f"{contract_conditions['expiryTime']}")
            elif 'payeeAddress' in contract_conditions.keys():
                contract_conditions['payeeAddress'] = find_word_index_fromstring(original_text,contract_conditions['payeeAddress'])
-                parsed_data = outputreturn('one-time-event-time-smartcontract-incorporation',f"{contract_token}", f"{contract_name}", f"{contract_address}", f"{original_text}", f"{contract_conditions['contractAmount']}", f"{minimum_subscription_amount}" , f"{maximum_subscription_amount}", f"{contract_conditions['payeeAddress']}", f"{contract_conditions['expiryTime']}")
+                if not check_flo_address(contract_conditions['payeeAddress']):
                    return outputreturn('noise')
                else:
                    return outputreturn('one-time-event-time-smartcontract-incorporation',f"{contract_token}", f"{contract_name}", f"{contract_address}", f"{original_text}", f"{contract_conditions['contractAmount']}", f"{minimum_subscription_amount}" , f"{maximum_subscription_amount}", f"{contract_conditions['payeeAddress']}", f"{contract_conditions['expiryTime']}")
    else:
-        parsed_data = outputreturn('noise')
+        return outputreturn('noise')
-    print(f"{parsed_data}\n") 
+
 for text in text_list1:
    print(super_main_function(text))
--- a/planning.py
+++ b/planning.py
@ -177,3 +177,14 @@ Phase 6 - Category based data field extraction
 Phase 7 - Output formatting and return (FINISHED)
 '''
 '''
 Allowed formats of Smart Contract and token names 
 1. First character should always be an Alphabet, lower case or upper case 
 2. The last character should always be an Alphabet, lower case or upper case 
 3. The middle characters can be a - or _
 Check for FLO Address 
 '''